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Prefacio 


La respuesta de los estudiantes y profesores a las tres primeras ediciones de Algebra lineal 
y sus aplicaciones ha sido muy gratificante. Esta cuarta edición brinda un importante apoyo 
tanto para la enseñanza como para el uso de la tecnología en el curso. Al igual que en las 
ediciones anteriores, el libro ofrece una introducción elemental actualizada al álgebra lineal 
y una amplia selección de aplicaciones interesantes. El material es accesible a estudiantes con 
la madurez que se consigue al finalizar de manera exitosa dos semestres de matemáticas de 
nivel universitario, por lo general, de cálculo. 

El objetivo principal del libro es ayudar a los estudiantes a dominar los conceptos básicos 
y las habilidades que usarán más adelante en sus carreras. Los temas expuestos siguen las re¬ 
comendaciones del Grupo de Estudio del Currículo de Álgebra Lineal, las cuales se basan en 
una cuidadosa investigación de las necesidades reales de los estudiantes y en un consenso entre 
profesionales de muchas disciplinas que utilizan el álgebra lineal. Esperamos que este curso sea 
una de las clases de matemáticas más útiles e interesantes para los estudiantes de licenciatura. 


LO NUEVO EN ESTA EDICIÓN 

El principal objetivo de esta revisión fue actualizar los ejercicios e incluir nuevos contenidos, 

tanto en el libro como en línea. 

1. Más del 25 por ciento de los ejercicios son nuevos o actualizados, en especial los ejer¬ 
cicios computacionales. Los conjuntos de ejercicios son una de las características más 
importantes de este libro, y estos nuevos ejercicios siguen el mismo estándar elevado de 
los conjuntos de ejercicios de las tres últimas ediciones. Están diseñados de tal forma que 
se refieren a los temas importantes de cada una de las secciones anteriores, y permiten 
que los alumnos desarrollen confianza al motivarlos a practicar y generalizar las nuevas 
ideas que acaban de estudiar. 

2. El 25 por ciento de los ejemplos introductorios de los capítulos son nuevos. Estas in¬ 
troducciones tienen que ver con aplicaciones de álgebra lineal y despiertan el interés en 
torno al desarrollo del tema que se presenta a continuación. El texto retoma el ejemplo 
introductorio en una sección al final de cada capítulo. 

3. Se incluye un nuevo capítulo, el 8, titulado “Geometría de los espacios vectoriales”, el 
cual presenta un tema novedoso que mis alumnos han disfrutado estudiar. Las seccio¬ 
nes 1, 2 y 3 ofrecen las herramientas geométricas básicas. La sección 6 utiliza estas ideas 
para estudiar las curvas y superficies de Bézier, las cuales se utilizan en gráficos elabo¬ 
rados con computadora en el campo de la ingeniería y en línea (en Adobe® lllustrator® 
y Macromedia® FreeHand®). Estas cuatro secciones se pueden cubrir en cuatro o cinco 
sesiones de clase de 50 minutos. 

El segundo curso en las aplicaciones de álgebra lineal suele comenzar con una 
revisión sustancial de las ideas principales del primer curso. Si una parte del capítulo 8 
se encuentra en el primer curso, el segundo podría incluir una breve reseña de las seccio¬ 
nes 1 a 3 y, luego, un enfoque de la geometría en las secciones 4 y 5. Eso conduciría, 
naturalmente, a los capítulos 9 y 10 que se presentan en línea, los cuales se han utilizado 
junto con el capítulo 8 en varias escuelas en los últimos cinco años. 
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4. Hay dos nuevos capítulos disponibles en línea en inglés, y se pueden utilizar en un segundo 
curso: 

Chapter 9. Optimization 

Chapter 10. Finite-State Markov Chains 

Se requiere un código de acceso y está disponible para todos los profesores que adopten el 
libro. Para más información, visite www.pearsonhighered.com/irc o póngase en contacto 
con su representante de Pearson. 

5. Diapositivas de PowerPoint® están disponibles para las 25 secciones principales del texto; 
también se incluyen más de 75 figuras del texto. 


CARACTERÍSTICAS DISTINTIVAS 

Introducción temprana a los conceptos clave 

Muchas de las ideas fundamentales del álgebra lineal se introducen dentro de las primeras siete 
lecturas en el contexto concreto de R", y después, gradualmente, se examinan desde diferentes 
puntos de vista. Más adelante, se presentan generalizaciones de estos conceptos como exten¬ 
siones naturales de ideas familiares, visualizadas a través de la intuición geométrica desarro¬ 
llada en el capítulo 1. Un logro importante del libro es que el nivel de dificultad es bastante 
uniforme durante todo el curso. 

Una visión moderna de la multiplicación de matrices 

Una buena notación es importante, y el libro refleja la manera en que los científicos e ingenie¬ 
ros utilizan el álgebra lineal en la práctica. Las definiciones y demostraciones se centran en las 
columnas de una matriz antes que en sus entradas. Un tema central es considerar un producto 
matriz-vector Ax como una combinación lineal de las columnas de A. Este enfoque moderno 
simplifica muchos argumentos, y vincula las ideas de espacio vectorial con el estudio de sis¬ 
temas lineales. 

Transformaciones lineales 

Las transformaciones lineales forman un “hilo” que se entreteje en la trama del libro. Su uso 
mejora el sentido geométrico del texto. En el capítulo 1, por ejemplo, las transformaciones 
lineales ofrecen una visión dinámica y gráfica de la multiplicación matriz-vector. 

Valores propios y sistemas dinámicos 

Los valores propios se presentan muy pronto en el libro, en los capítulos 5 y 7. Como este 
material se estudia durante varias semanas, los estudiantes tienen más tiempo de lo habitual 
para aprender y revisar tales conceptos fundamentales. Los valores propios se aplican a sis¬ 
temas dinámicos discretos y continuos, los cuales se presentan en las secciones 1.10, 4.8 
y 4.9, y en las cinco secciones del capítulo 5. Algunos cursos llegan al capítulo 5, después 
de aproximadamente cinco semanas, cubriendo las secciones 2.8 y 2.9 en vez del capítulo 4. 
Estas dos secciones opcionales presentan todos los conceptos de espacio vectorial del capí¬ 
tulo 4 necesarios para el capítulo 5. 

Ortogonalidad y problemas de mínimos cuadrados 

Estos temas reciben un tratamiento más completo que el que se otorga comúnmente en los 
libros básicos. El Grupo de Estudio del Currículo de Álgebra Lineal ha hecho hincapié en 
la necesidad de contar con una unidad sustancial de ortogonalidad y problemas de mínimos 
cuadrados, ya que la ortogonalidad desempeña un importante papel en los cálculos compu- 
tacionales y en el álgebra lineal numérica, y porque, con frecuencia, en el trabajo práctico 
surgen sistemas lineales inconsistentes. 
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CARACTERÍSTICAS PEDAGÓGICAS 

Aplicaciones 

Una amplia selección de aplicaciones muestra el poder del álgebra lineal para explicar princi¬ 
pios fundamentales y simplificar los cálculos en ingeniería, ciencias de la computación, mate¬ 
máticas, física, biología, economía y estadística. Algunas aplicaciones se presentan en secciones 
separadas, mientras que otras se explican con ejemplos y ejercicios. Además, cada capítulo se 
inicia con un ejemplo introductorio que prepara el escenario para algunas aplicaciones del ál¬ 
gebra lineal y sirve de base para el desarrollo de las matemáticas que siguen. Después, el texto 
considera nuevamente la aplicación en una sección cercana al final del capítulo. 

Un fuerte énfasis geométrico 

Todos los conceptos importantes en el curso cuentan con una interpretación geométrica, ya 
que muchos estudiantes aprenden mejor cuando logran visualizar una idea. Aquí se presentan 
más dibujos de lo habitual, y algunas de las figuras nunca antes se han presentado en un libro 
de álgebra lineal. 

Ejemplos 

Este libro dedica una mayor proporción de su material de exposición a ejemplos, en compa¬ 
ración con la mayoría de libros de álgebra lineal. Hay más ejemplos de los que un profesor 
presenta normalmente en clase. Puesto que los ejemplos se escribieron con sumo cuidado y 
con detalle, los estudiantes pueden leerlos por su cuenta. 

Teoremas y demostraciones 

Los resultados importantes se establecen como teoremas. Otros datos útiles se presentan en 
recuadros, para una fácil localización. La mayoría de los teoremas incluyen demostraciones 
formales, escritas pensando en el alumno principiante. En algunos casos, los cálculos esencia¬ 
les de una demostración se muestran en un ejemplo cuidadosamente elegido. Algunas com¬ 
probaciones de rutina se dejan para los ejercicios, cuando sea benéfico para los estudiantes. 

Problemas de práctica 

Antes de cada conjunto de ejercicios se incluyen problemas de práctica seleccionados con 
gran cuidado. Las soluciones completas se presentan después del conjunto de ejercicios. Es¬ 
tos problemas se centran en los aspectos problemáticos del conjunto de ejercicios o sirven de 
“calentamiento” para los ejercicios; con frecuencia, las soluciones contienen útiles consejos 
o advertencias acerca del trabajo que hay que realizar. 

Ejercicios 

El gran número de ejercicios incluye desde algunos que tienen que ver con cálculos de rutina 
hasta preguntas conceptuales que requieren de mayor reflexión. Un buen número de preguntas 
innovadoras destacan las dificultades conceptuales que he encontrado en los documentos de 
los estudiantes en los últimos años. Cada conjunto de ejercicios está cuidadosamente organi¬ 
zado en el mismo orden general que el libro, de manera que las tareas se pueden encontrar 
fácilmente cuando solo se ha estudiado una parte de la sección. Una característica notable de 
los ejercicios es su sencillez numérica. El contenido de los problemas se puede ordenar rápi¬ 
damente, para que los estudiantes dediquen poco tiempo a los cálculos numéricos. Los ejerci¬ 
cios se concentran en enseñar a razonar antes que en realizar cálculos mecánicos. Los ejercicios 
de la cuarta edición conservan la integridad de los que se incluyeron en la tercera edición, y 
presentan nuevos problemas para estudiantes y profesores. 

Los ejercicios marcados con el símbolo [M| están diseñados para trabajarse con la ayuda 
de un “programa de Matrices” (por ejemplo, programas computacionales, como MATLAB®, 
Maple™, Mathematica®, MathCad®, o Derive™, o calculadoras programables con capacida¬ 
des matriciales, como las que fabrica Texas Instruments). 
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Preguntas verdadero/falso 

Para animar a los estudiantes a leer todo el libro y a pensar críticamente, he desarrollado 
300 preguntas sencillas de falso/verdadero que se presentan en 33 secciones del libro, justo 
después de los problemas computacionales. Estas preguntas se pueden contestar directamente 
del libro, y preparan al estudiante para los problemas conceptuales que siguen. Los estudian¬ 
tes aprecian estas preguntas una vez que valoran la importancia de leer con cuidado el libro. 
Con base en las pruebas de clase y los análisis con los estudiantes, decidí no incluir las res¬ 
puestas en el libro. Se cuenta con 150 preguntas adicionales de falso/verdadero (casi siem¬ 
pre al final de los capítulos) para comprobar la comprensión del material. El libro presenta 
solo respuestas con V o F para la mayoría de estas preguntas, pero omite las justificaciones 
de las respuestas (las cuales, por lo general, requieren de cierto razonamiento). 

Ejercicios de escritura 

La capacidad de escribir enunciados matemáticos coherentes en español es esencial para todos 
los estudiantes de álgebra lineal, y no solo para aquellos que cursan un posgrado en matemáti¬ 
cas. El libro incluye muchos ejercicios para los que una justificación por escrito es parte de la 
respuesta. Los ejercicios conceptuales que requieren una prueba corta, por lo general, incluyen 
consejos que ayudan a los estudiantes a comenzar. Para todos los ejercicios de escritura de 
numeración impar, en la parte final del libro, se incluye ya sea una solución o una sugerencia. 

Temas computacionales 

El libro hace hincapié en los efectos de la computadora tanto en el desarrollo como en la prác¬ 
tica del álgebra lineal en las ciencias y la ingeniería. Las frecuentes notas numéricas llaman 
la atención en tomo a problemas computacionales; además, distinguen entre los conceptos 
teóricos, como la inversión de matrices, y las implementaciones computacionales, como la 
factorización LU. 


APOYO EN LÍNEA 


El sitio Web en www.pearsonenespañol.comAay contiene material de apoyo para el libro de 
texto. Para los estudiantes, incluye hojas de repaso y exámenes de práctica (con soluciones) 
que cubren los temas principales en el libro. Estas secciones provienen directamente de cur¬ 
sos que he impartido en los últimos años. Cada hoja de repaso identifica definiciones clave, 
así como teoremas y habilidades de una parte específica del libro. 

Aplicaciones de los capítulos 

El sitio Web también contiene siete estudios de caso, los cuales amplían los temas introdu¬ 
cidos al inicio de cada capítulo, al agregar datos del mundo real y la posibilidad de realizar 
una exploración más profunda. Por otro lado, más de veinte proyectos de aplicación amplían 
los temas del libro e introducen nuevas aplicaciones, como splines cúbicos, rutas de vuelo 
de aerolíneas, matrices de dominio en competencias deportivas y códigos de corrección de 
errores. Algunas aplicaciones matemáticas son técnicas de integración, ubicación de raíces 
polinomiales, secciones cónicas, superficies cuadráticas y extremos de funciones de dos va¬ 
riables. También se incluyen temas de álgebra lineal numérica, como números de condición, 
factorizaciones de matrices y el método QR para encontrar valores propios. Entretejidos en 
cada análisis, se encuentran ejercicios que pueden implicar grandes conjuntos de datos (por 
lo que requieren de tecnología para su solución). 

Introducción a la tecnología 

Si el curso incluye un trabajo con MATLAB, Maple, Mathematica o calculadoras TI, se 
puede leer uno de los proyectos en el sitio Web para tener una introducción a la tecnología. 
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Archivos de datos 

Cientos de archivos contienen datos de 900 ejercicios del texto, estudios de caso y proyec¬ 
tos de aplicación. Los datos están disponibles en www.pearsonenespañol.com/lay en una 
variedad de formatos, para MATLAB, Maple, Mathematica y las calculadoras graficadoras 
TI-83+/86/89. Al permitir a los alumnos acceder a las matrices y los vectores de un problema 
particular con solo pulsar unas cuantas teclas, los archivos de datos eliminan los errores de 
captura de datos y ahorran tiempo en la tarea. 

Proyectos MATLAB 

Estos proyectos de exploración invitan a los estudiantes a descubrir los aspectos matemáti¬ 
cos y numéricos básicos de álgebra lineal. Escritos por Rick Smith, se han desarrollado para 
acompañar los cursos de álgebra lineal computacional en la Universidad de Florida, que han 
utilizado Algebra lineal y sus aplicaciones durante muchos años. Se hace referencia a los 
proyectos por medio de un icono I web | en puntos adecuados del libro. Alrededor de la mitad 
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Nota para los estudiantes 


Este curso es potencialmente el más interesante y valioso de los cursos de matemáticas de 
licenciatura. De hecho, algunos estudiantes me han escrito o han hablado conmigo después 
de la graduación para decirme que aún utilizan este libro de cuando en cuando como una refe¬ 
rencia en su carrera en las grandes corporaciones y en las escuelas de posgrado de ingeniería. 
Los siguientes comentarios ofrecen algunos consejos prácticos e información para ayudarle 
a dominar el material y disfrutar del curso. 

En álgebra lineal, los conceptos son tan importantes como los cálculos. Los sencillos 
ejercicios numéricos que se incluyen al principio de cada conjunto de ejercicios solo le 
ayudarán a comprobar su comprensión de los procedimientos básicos. Más adelante en su 
carrera, las computadoras harán los cálculos, pero usted tendrá que elegir cuáles son perti¬ 
nentes, saber interpretar los resultados, y después explicar los resultados a otras personas. 
Por esta razón, muchos ejercicios en el libro le piden que explique o justifique sus cálculos. 
Con frecuencia se solicita una explicación por escrito como parte de la respuesta. Para los 
ejercicios con numeración impar, se incluye ya sea la explicación deseada o, al menos, una 
buena sugerencia. Debe evitar la tentación de consultar esas respuestas antes de haber tra¬ 
tado de escribir la solución. De lo contrario, es probable que crea que entiende algo cuando 
en realidad no es así. 

Para dominar los conceptos de álgebra lineal, tendrá que leer y releer el texto con cuida¬ 
do. Los nuevos términos aparecen en negritas, a veces dentro de un recuadro de definición. 
Al final del libro se incluye un glosario. Algunos hechos importantes se establecen como 
teoremas o se destacan en recuadros sombreados, para una fácil localización. Le animo a que 
lea las primeras cinco páginas del prefacio para aprender más acerca de la estructura de este 
libro. Esto le dará una idea para comprender cómo puede continuar el curso. 

En un sentido práctico, el álgebra lineal es un lenguaje. Usted tiene que aprender este 
lenguaje de la misma manera que un idioma extranjero, esto es, con el trabajo diario. El ma¬ 
terial que se presenta en una sección no es fácil de entender a menos que haya estudiado a 
fondo el libro y que haya trabajado los ejercicios de las secciones anteriores. ¡Mantenerse al 
día con el curso le ahorrará mucho tiempo y angustia! 


Notas numéricas 

Espero que lea las notas numéricas en el texto, incluso si no está utilizando una computadora 
o una calculadora gráfica con el libro. En la vida real, la mayoría de las aplicaciones del ál¬ 
gebra lineal implican cálculos numéricos que están sujetos a algún error numérico, aunque 
quizás este sea muy pequeño. Las notas numéricas le advertirán las posibles dificultades en 
el uso del álgebra lineal más adelante en su carrera, y si usted estudia las notas ahora, es más 
probable que las recuerde después. 

Si le gusta leer las notas numéricas, es posible que desee tomar un curso más tarde en 
álgebra lineal numérica. Debido a la gran demanda de mayor capacidad para realizar cálcu¬ 
los, científicos de la computación y matemáticos trabajan en álgebra lineal numérica para 
desarrollar algoritmos de cálculos más rápidos y más confiables, mientras que los ingenie¬ 
ros eléctricos diseñan computadoras pequeñas y rápidas para ejecutar algoritmos. Este es un 
campo emocionante, y su primer curso de álgebra lineal le ayudará a prepararse para ello. 
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Ecuaciones lineales 
en álgebra lineal 


EJEMPLO INTRODUCTORIO 

Modelos lineales en economía 
e ingeniería 

Al final del verano de 1949, Wassily Leontief, profesor de 
Harvard, introducía con cuidado la última de sus tarjetas 
perforadas en la computadora Mark II de la universidad. 

Las tarjetas contenían información acerca de la economía 
de Estados Unidos; se trataba de un resumen de más de 
250,000 datos generados por la Oficina de Estadística 
Laboral (U.S. Bureau of Labor) durante dos años de intenso 
trabajo. Leontief dividió la economía estadounidense en 
500 “sectores”, que incluían las industrias carbonífera, 
automotriz, de comunicaciones, etcétera. Para cada sector, 
escribió una ecuación lineal que describía cómo la industria 
en cuestión distribuía su producto hacia los otros sectores de 
la economía. Como la computadora Mark II, una de las más 
grandes de su época, no podía manejar el sistema resultante 
de 500 ecuaciones y 500 incógnitas, Leontief redujo el 
problema a un sistema de 42 ecuaciones y 42 incógnitas. 

Programar la Mark II para manejar las 42 ecuaciones 
de Leontief requirió varios meses de trabajo, y él estaba 
ansioso por ver cuánto tardaría la computadora en resolver 
el problema. La máquina emitió zumbidos y sus luces 
parpadearon durante 56 horas antes de que finalmente 
arrojara un resultado. En las secciones 1.6 y 2.6 se analizará 
la naturaleza de esa solución. 

Leontief, galardonado en 1973 con el Premio Nobel de 
Economía, abrió la puerta a una nueva era en la elaboración 
de modelos matemáticos en economía. Sus esfuerzos en 
Harvard, en 1949, representaron uno de los primeros usos 
significativos de las computadoras para analizar lo que, 



en esa época, era un modelo matemático de gran escala. 
Desde entonces, investigadores en muchos otros campos han 
empleado computadoras para analizar modelos matemáticos. 
Debido a las enormes cantidades de datos implicados, 
los modelos, por lo regular, son lineales ; es decir, se 
describen mediante sistemas de ecuaciones lineales. 

La importancia del álgebra lineal para diversas 
aplicaciones ha crecido en proporción directa al incremento 
de la capacidad de las computadoras, y cada nueva 
generación de hardware y software dispara la demanda 
de capacidades aun mayores. Por ello, la ciencia de la 
computación está fuertemente vinculada con el álgebra 
lineal a través del explosivo crecimiento de los 
procesamientos en paralelo y el cálculo a gran escala. 

Ahora los científicos e ingenieros trabajan en problemas 
cada vez más complejos, lo que era impensable hace algunas 
décadas. Actualmente, ¡el álgebra lineal tiene mayor valor 
potencial para estudiantes de muchos campos científicos 
y de negocios que cualquier otra materia de matemáticas! 

El material que se presenta en este libro ofrece el 
fundamento para un trabajo posterior en muchas áreas 
interesantes. A continuación se mencionan unas cuantas 
posibilidades; otras se describirán más adelante. 

• Exploración petrolera. Cuando un barco busca 
depósitos submarinos de petróleo, sus computadoras 
resuelven todos los días miles de sistemas de 
ecuaciones lineales. Los datos sísmicos de las 
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ecuaciones se obtienen a partir de las ondas de cho¬ 
que submarinas generadas por explosiones de pistolas 
de aire. Las ondas rebotan en las rocas bajo el agua, y 
los geófonos conectados a la popa del barco mediante 
cables de varios kilómetros se encargan de medirlas. 

• Programación lineal. Actualmente, muchas 

decisiones empresariales importantes se toman con 
base en modelos de programación lineal que utilizan 
cientos de variables. La industria de las aerolíneas, 
por ejemplo, utiliza la programación lineal para 


organizar los itinerarios de las tripulaciones de vuelo, 
monitorizar la ubicación de los aviones o planear la 
variada agenda de los servicios de apoyo, como las 
actividades operativas y de mantenimiento en 
las terminales aéreas. 

• Redes eléctricas. Los ingenieros utilizan software 
de simulación para diseñar circuitos eléctricos y 
microchips, lo que implica millones de transistores. 
Dicho software se basa en técnicas de álgebra lineal 
y en sistemas de ecuaciones lineales. 

I WEB 


Los sistemas de ecuaciones lineales constituyen el corazón del álgebra lineal, y este capítulo los 
utiliza para introducir, de manera sencilla y concreta, algunos de los conceptos centrales del 
álgebra lineal. Las secciones 1.1 y 1.2 presentan un método sistemático para resolver sistemas 
de ecuaciones lineales. En este libro se empleará dicho algoritmo para realizar diversos cálcu¬ 
los. Las secciones 1.3 y 1.4 muestran cómo un sistema de ecuaciones lineales es equivalente a 
una ecuación vectorial y a una ecuación matricial. Esta equivalencia reducirá problemas que 
implican combinaciones lineales de vectores a preguntas acerca de sistemas de ecuaciones 
lineales. Los conceptos fundamentales de generación, independencia lineal y transformacio¬ 
nes lineales, que se estudiarán en la segunda mitad de este capítulo, desempeñarán un papel 
esencial a lo largo del libro conforme se explore la belleza y el poder del álgebra lineal. 


1.1 


SISTEMAS DE ECUACIONES LINEALES 


Una ecuación lineal en las variables X\,..., x„ es una ecuación que puede escribirse en la forma 

a\X\ + a 2 x 2 H-1- a„x„ = b (1) 

donde b y los coeficientes ai,..., a n son números reales o complejos, que generalmente se co¬ 
nocen de antemano. El subíndice n puede ser cualquier entero positivo. En los ejemplos y 
ejercicios del libro, n normalmente está entre 2 y 5. En problemas de la vida real, n podría 
ser 50 o 5000, o incluso mayor. 

Las ecuaciones 


4xi — 5 x 2 + 2 = X\ y x 2 =- 2 (Vó — Xi) + X 3 
son lineales porque se pueden reordenar algebraicamente en la forma de la ecuación (1): 
3xi — 5 x'2 = — 2 y 2x'i + X 2 — X 3 = 2Vó 


Las ecuaciones 


4xi — 5x2 = X 1 X 2 y X 2 = 2 v /xT — 6 

no son lineales debido a la presencia de X 1 X 2 en la primera ecuación y de ^fx{ en la segunda. 

Un sistema de ecuaciones lineales (o sistema lineal) es una colección de una o más 
ecuaciones lineales que implican las mismas variables, por ejemplo, xi,..., x„. Un ejemplo es 


2xi — X 2 + 1.5x'3 = 8 

Xi — 4 x'3 = —7 


(2) 
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Una solución del sistema es una lista de números (íi, ,s' 2 ,-. -, s„) que da validez a cada ecuación 

cuando se utilizan los valores si,..., s n en lugar de jci,_, x„, respectivamente. Por ejemplo, 

(5, 6.5, 3) es una solución del sistema (2) porque al sustituir estos valores en (2) para xu X 2 , 
xj, respectivamente, las ecuaciones se simplifican a 8 = 8 y —7 = —7. 

El conjunto de todas las posibles soluciones se llama conjunto solución del sistema 
lineal. Se dice que dos sistemas lineales son equivalentes si tienen el mismo conjunto solu¬ 
ción. Es decir, cada solución del primer sistema es una solución del segundo sistema, y cada 
solución del segundo sistema también es una solución del primero. 

Es fácil encontrar el conjunto solución de un sistema de dos ecuaciones lineales con dos 
variables porque equivale a obtener la intersección de dos rectas. Un problema común es 

Xi — 2x2 = — 1 

-xi + 3*2 = 3 

Las gráficas de esas ecuaciones son líneas rectas, las cuales se denotan como €i y € 2 . Un par 
de números (x\, xi) satisface ambas ecuaciones del sistema si y solo si el punto (x\, X 2 ) está 
sobre y € 2 . En el sistema anterior, la solución es el único punto (3, 2), lo que puede com¬ 
probarse fácilmente. Véase la figura 1. 



FIGURA 1 Exactamente una solución. 


Desde luego, dos rectas no necesitan intersecarse en un solo punto; podrían ser parale¬ 
las, o coincidir y, así, “intersecarse” en todos los puntos de la recta. La figura 2 muestra las 
gráficas que corresponden a los siguientes sistemas: 

a) x\ — 2 x 2 = — 1 b) x\ — 2 x 2 = — 1 

— x\ + 2x2 = 3 — x\ + 2x2 = 1 



a) b) 

FIGURA 2 a ) No hay solución, b) Número infinito de soluciones. 


Las figuras 1 y 2 ilustran el siguiente hecho general acerca de los sistemas lineales, el 
cual se comprobará en la sección 1 . 2 . 
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Un sistema de ecuaciones lineales tiene 

1 . ninguna solución, o 

2 . exactamente una solución, o 

3. un número infinito de soluciones. 


Se dice que un sistema de ecuaciones lineales es consistente si tiene una solución o un nú¬ 
mero infinito de soluciones; un sistema es inconsistente cuando no tiene ninguna solución. 


Notación matricial 

La información esencial de un sistema lineal puede registrarse de forma compacta en un arre¬ 
glo rectangular llamado matriz. Dado el sistema 


Xi — 2X2 + *3 = 0 

2x 2 — 8*3 = 8 
—4a'! + 5a 2 + 9x3 = — 9 


(3) 


con los coeficientes de cada variable alineados en columnas, la matriz 

" 1-2 1 " 

0 2-8 
-4 5 9 

se llama matriz coeficiente (o matriz de coeficientes) del sistema (3), y 

" 1-2 1 0 " 

0 2-88 
-4 5 9-9 


(4) 


se llama matriz aumentada del sistema. (Aquí la segunda fila contiene un cero porque 
la segunda ecuación podría escribirse como 0 • X\ + 2x2 — 8x3 = 8). La matriz aumentada 
de un sistema consiste en la matriz de coeficientes con una columna adicional que contiene 
las constantes de los miembros derechos de las ecuaciones. 

El tamaño de una matriz indica su número de filas y columnas. La matriz aumentada (4) 
tiene 3 filas y 4 columnas, por lo que es una matriz de 3 x 4 (que se lee “3 por 4”). Si m y n 
son enteros positivos, entonces una matriz de m x n es un arreglo rectangular de números 
con m filas y n columnas. (Siempre va primero el número de filas). La notación matricial 
simplificará los cálculos en los ejemplos que siguen. 


Solución de un sistema lineal 

Esta sección y la siguiente describen un algoritmo, o un procedimiento sistemático, para re¬ 
solver sistemas lineales. La estrategia básica es remplazar un sistema por otro equivalente (es 
decir, uno con el mismo conjunto solución) y que sea más fácil resolver. 

En general, use el término X\ de la primera ecuación de un sistema para eliminar los 
términos X\ en las ecuaciones restantes. Después, utilice el término X 2 en la segunda ecuación 
para eliminar los términos X 2 en las demás ecuaciones, y así sucesivamente, hasta que final¬ 
mente obtenga un sistema equivalente de ecuaciones muy sencillo. 

Se utilizan tres operaciones básicas para simplificar un sistema lineal: remplazar una 
ecuación por la suma de esta y un múltiplo de otra ecuación, intercambiar dos ecuaciones, y 
multiplicar todos los términos de una ecuación por una constante distinta de cero. Después del 
primer ejemplo, resultará claro por qué esas tres operaciones no alteran el conjunto solución 
del sistema. 
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EJEMPLO 1 Resuelva el sistema (3). 

SOLUCIÓN Aquí se muestra el procedimiento de eliminación, con y sin notación matricial, 
y los resultados se colocan uno al lado del otro para facilitar la comparación: 


X'i — 2 x 2 + X 3 = 0 

2 x 2 — 8 x 3 = 8 

—4xi + 5 x 2 + 9 x 3 = — 9 


1 -2 
0 2 
-4 5 


1 

-8 

9 


0 

8 

-9 


Mantenga x\ en la primera ecuación y elimínela en las otras ecuaciones. Para hacerlo, sume 
la ecuación 1 multiplicada por 4 a la ecuación 3. Después de cierta práctica, estos cálculos 
se podrán efectuar mentalmente: 


4-[ecuación 1 ] 
+ [ecuación 3] 
[nueva ecuación 3] 


4xi — 8 x 2 + 4 x 3 = 0 

—4xi + 5x2 + 9x3 = — 9 
— 3x 2 + 13x3 = — 9 


El resultado de este cálculo se escribe en lugar de la tercera ecuación original: 


x‘i — 2x2 + X3 = 0 

2x2 — 8x3 = 8 

— 3x2 + 13x3 = —9 


1-210 
0 2-88 
0 -3 13 -9 


Ahora, multiplicamos la ecuación 2 por 1/2 para así obtener 1 como coeficiente de X 2 . (Este 
cálculo simplificará la aritmética en el siguiente paso). 


x'i — 2x2 + X3 = 0 

X 2 — 4x 3 = 4 

— 3x2 + 13x3 = —9 


1-210 
0 1-44 

0 -3 13 -9 


Utilice X 2 de la ecuación 2 para eliminar — 3 x 2 en la ecuación 3. El cálculo “mental’' es 


3 • [ecuación 2] 
+ [ecuación 3] 
[nueva ecuación 3] 


3 x 2 — 12x3 = 12 
—3x2 + 13 x‘3 = —9 
X 3 = 3 


El nuevo sistema tiene forma triangular: 1 

1-210 
0 1-44 

0 0 13 


XI — 2X2 + X 3 = 0 
X 2 — 4X3 = 4 
X'x = 3 


Finalmente, se desea eliminar el término — 2 x 2 de la ecuación 1, pero es más eficiente usar 
primero X 3 de la ecuación 3 para eliminar los términos — 4 x 3 y +X 3 en las ecuaciones 2 y 1. 
Los dos cálculos “mentales” son 

4-[ec. 3]: 4 x 3=12 — l-[ec. 3]: — X 3 = —3 

+ [ec. 2]: X 2 — 4 .Y 3 = 4 + [ec. 1]: x\ — 2 x 2 + X 3 = 0 

[nueva ec. 2 ]: X 2 =16 [nueva ec. 1 ]: xi - 2 x 2 = -3 


1 En la siguiente sección se remplazará el término intuitivo triangular por uno más preciso. 
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Es conveniente combinar los resultados de esas dos operaciones: 


X\ — 2x 2 = — 3 

x 2 = 16 

X3 = 3 


1-2 0-3 

0 1 0 16 
0 0 1 3 



Cada una de las ecuaciones 
originales determina un plano 
en el espacio tridimensional. 
El punto (29, 16, 3) pertenece 
a los tres planos. 


Ahora, una vez que se ha eliminado la columna que está sobre X 3 en la ecuación 3, regrese 
a X 2 en la ecuación 2 y utilícela para eliminar — 2 x 2 sobre ella. Gracias al trabajo previo con 
X 3 , ahora no hay operaciones que impliquen términos con X 3 . Sume dos veces la ecuación 2 
a la ecuación 1 para obtener el sistema: 


'X\ = 29 

" 1 

0 

0 

29" 

x 2 = 16 

0 

1 

0 

16 

x 3 = 3 

0 

0 

1 

3 


En esencia, el proceso está terminado. Se observa que la única solución del sistema original 
es (29, 16, 3). Sin embargo, puesto que son muchos los cálculos realizados, es recomendable 
comprobar los resultados. Para comprobar que (29, 16, 3) es una solución, sustituya esos 
valores en el lado izquierdo del sistema original, y calcule: 

(29) - 2(16)+ (3) = 29-32 + 3 = 0 
2(16) - 8(3) = 32-24 = 8 
-4(29) + 5(16) + 9(3) = -116+ 80 + 27 = -9 

Los resultados concuerdan con el lado derecho del sistema original, de manera que (29, 16, 3) 
es una solución del sistema. ■ 

El ejemplo 1 muestra cómo las operaciones con las ecuaciones de un sistema lineal 
corresponden a las operaciones en las filas adecuadas de la matriz aumentada. Las tres ope¬ 
raciones básicas mencionadas con anterioridad corresponden a las siguientes operaciones 
en la matriz aumentada. 


OPERACIONES ELEMENTALES DE FILA 

1. (Remplazo) Sustituir una fila por la suma de sí misma y un múltiplo de otra fila . 2 

2. (Intercambio) Intercambiar dos filas. 

3. (Escalamiento) Multiplicar todos los elementos de una fila por una constante dife¬ 
rente de cero. 


Las operaciones de fila pueden aplicarse a cualquier matriz, no solo a las matrices au¬ 
mentadas de un sistema lineal. Dos matrices son equivalentes por filas si existe una secuen¬ 
cia de operaciones elementales de fila que transforme una matriz en otra. 

Es importante observar que las operaciones de fila son reversibles. Si dos filas se inter¬ 
cambian, es posible hacerlas retornar a sus posiciones originales mediante otro intercambio. 
Si una fila se multiplica por una constante c distinta de cero, entonces al multiplicar la nueva 
fila por 1/c se obtiene la fila original. Por último, considere una operación de remplazo que 
implica a dos filas —por ejemplo, las filas 1 y 2 — y suponga que a la fila 2 se le suma la 
fila 1 multiplicada por c para producir una nueva fila 2. Para “revertir” esta operación, sume 
la fila 1 multiplicada por — c a la nueva fila 2 para así obtener la fila 2 original. Véase los 
ejercicios 29 al 32 al final de esta sección. 


• Una forma alternativa de expresar la operación de remplazo de filas es: “Sume a una fila un múltiplo de otra fila” 
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Por el momento, estamos interesados en las operaciones de fila sobre la matriz aumen¬ 
tada de un sistema de ecuaciones lineales. Suponga que un sistema se transforma en otro 
mediante operaciones de fila. Considerando cada tipo de operación de fila, puede verse que 
cualquier solución del sistema original continúa siendo una solución del nuevo sistema. A la 
inversa, puesto que el sistema original se puede obtener mediante operaciones de fila sobre 
el nuevo sistema, cada solución del nuevo sistema también es solución del sistema original. 
Este análisis justifica el siguiente enunciado. 

Si las matrices aumentadas de dos sistemas lineales son equivalentes por filas, entonces 
los dos sistemas tienen el mismo conjunto solución. 


A pesar de que el ejemplo 1 es largo, después de cierta práctica se desarrollará habilidad 
para realizar los cálculos con rapidez. En el texto y en los ejercicios de este libro, las opera¬ 
ciones de fila por lo general serán muy fáciles de efectuar, lo que permitirá al lector enfocarse 
en los conceptos subyacentes. Pero debe aprender a realizar con exactitud las operaciones de 
fila porque se utilizarán a lo largo del libro. 

El resto de esta sección muestra cómo emplear operaciones de fila para determinar el 
tamaño de un conjunto solución, sin resolver completamente el sistema lineal. 

Preguntas de existencia y unicidad 

La sección 1.2 mostrará por qué un conjunto solución de un sistema lineal puede no contener 
ninguna solución, o bien, tener una solución o un número infinito de soluciones. Las res¬ 
puestas a las siguientes dos preguntas determinarán la naturaleza del conjunto solución de 
un sistema lineal. 

Para determinar qué posibilidad es verdadera para un sistema particular, nos planteamos 
dos preguntas. 


DOS PREGUNTAS FUNDAMENTALES ACERCA DE UN SISTEMA LINEAL 

1. ¿El sistema es consistente, es decir, al menos existe una solución? 

2. Si existe una solución, ¿solo hay una, es decir, la solución es únical 


Estas dos preguntas se presentarán a lo largo del libro, en diversas circunstancias. Esta sec¬ 
ción y la siguiente le mostrarán cómo responder a esas preguntas usando operaciones de fila 
sobre la matriz aumentada. 


EJEMPLO 2 Determine si el siguiente sistema es consistente 

X\ — 2X2 + X 3 = 0 

2x 2 — 8x3 = 8 

—4xi 4- 5x2 + 9x3 = —9 


SOLUCIÓN Este es el sistema del ejemplo 1. Suponga que se han efectuado las operaciones 
de fila necesarias para obtener la forma triangular 


xi — 2.X2 + X3 = 0 
X 2 — 4 .T 3 = 4 
X 3 = 3 


1-210 
0 1-44 

0 0 13 


En este punto, conocemos X 3 . Si se sustituyera el valor de X 3 en la ecuación 2, entonces se 
podría calcular X 2 y, por lo tanto, se podría obtener X| de la ecuación 1. Así que existe una 
solución; el sistema es consistente. (En efecto, X 2 está determinada de manera unívoca por la 
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ecuación 2 ya que sólo tiene un valor posible, y en consecuencia X\ está determinada de 
forma unívoca por la ecuación 1. Por lo tanto, la solución es única). ■ 

EJEMPLO 3 Determine si el siguiente sistema es consistente 


X2 — 4X3 = 8 

2xi — 3x2 + 2x3 = 1 (5) 

5x\ — 8 x 2 + 7x3 = 1 

SOLUCIÓN La matriz aumentada es 


0 1-48 

2-321 
5-871 


Para obtener una x\ en la primera ecuación, se intercambian las filas 1 y 2: 


2-321 
0 1-48 

5-871 


Para eliminar el término 5xi en la tercera ecuación, a la fila 3 se suma la fila 1 multiplicada 
por -5/2: 


2-321 
0 1-48 

0 -1/2 2 -3/2 


( 6 ) 


Ahora, use el término X 2 en la segunda ecuación para eliminar el término — (1/2)X2 en la 
tercera ecuación. A la fila 3, sume la fila 2 multiplicada por 1/2: 


2-3 2 1 

0 1-4 8 

0005/2 


(7) 



Este sistema es inconsistente 
porque no existe un punto que 
pertenezca a los tres planos de 
manera simultánea. 


Ahora la matriz aumentada está en forma triangular. Para interpretarla correctamente, con¬ 
viene regresar a la notación con ecuaciones: 


2xi — 3x 2 + 2x3 = 1 

X2 — 4x3 = 8 (8) 

0 = 5/2 

La ecuación 0 = 5/2 es una forma abreviada de Oxq 4- 0x2 + OX3 = 5/2. Este sistema en 
forma triangular, evidentemente, tiene una contradicción inherente. No existen valores de xi, 
X2, X3 que satisfagan la ecuación (8) porque la ecuación 0 = 5/2 nunca es válida. Como (5) y 
(8) tienen el mismo conjunto solución, entonces el sistema original es inconsistente (es decir, 
no tiene solución). ■ 

Preste atención a la matriz aumentada en (7). Su última fila es característica de un sis¬ 
tema inconsistente en forma triangular. 
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- NOTA NUMÉRICA - 

En problemas del mundo real, los sistemas de ecuaciones lineales se resuelven en compu¬ 
tadora. Para una matriz de coeficientes cuadrada, los programas computacionales casi 
siempre utilizan el algoritmo de eliminación presentado aquí y en la sección 1 . 2 , aun¬ 
que ligeramente modificado para obtener mayor exactitud. 

La gran mayoría de los problemas de álgebra lineal en los negocios y en la indus¬ 
tria se resuelven con programas que emplean aritmética de punto flotante. Los núme¬ 
ros se representan como decimales ±.dyd p X 10', donde res un entero, y el número p 
de dígitos a la derecha del punto decimal, por lo general, está entre 8 y 16. La aritmética 
con dichos números normalmente es inexacta, porque el resultado debe redondearse 
(o truncarse) al número de dígitos almacenados. Se introduce el “error de redondeo” 
cuando un número como 1/3 ingresa a la computadora, ya que su representación deci¬ 
mal debe ser aproximada por una cantidad finita de dígitos. Por fortuna, las inexactitu¬ 
des en la aritmética de punto flotante rara vez causan problemas. Las notas numéricas 
en este libro ocasionalmente le advertirán sobre asuntos que deberá considerar más 
adelante en su carrera profesional. 


PROBLEMAS DE PRÁCTICA 

A lo largo del libro, es conveniente resolver los problemas de práctica antes de trabajar los 
ejercicios. Las soluciones se presentan después de cada conjunto de ejercicios. 

1. Exprese con palabras la siguiente operación elemental de fila que debe efectuarse en el 
sistema para resolverlo. [En a) es posible más de una respuesta]. 


a) x\ + 4 x 2 — 2 x 3 + 8 x 4 = 12 
*2 — 7X3 + 2X4 = — 4 
5X3 — X 4 = 7 

X 3 + 3X4 = —5 


b) x\ — 3 x 2 + 5 x 3 — 2 x '4 = 0 

x 2 + 8 x 3 = -4 

2 x 3 = 3 

X 4 = 1 


2. La matriz aumentada de un sistema lineal se transformó, mediante operaciones de fila, 
en la forma que se indica a continuación. Determine si el sistema es consistente. 


15 2-6 

0 4-72 

0 0 5 0 


3. ¿(3, 4, —2) es una solución para el siguiente sistema? 

5xi — X 2 + 2 x 3 = 7 

—2xi 6 x 2 -I - 9 x '3 — 0 
— 7xi + 5 .X 2 — 3x3 = — 7 


4 . ¿Para qué valores de h y k es consistente el siguiente sistema? 


2 xi — X 2 = h 
— 6 x 1 + 3x2 = k 
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1.1 EJERCICIOS 


En los ejercicios 1 a 4 resuelva cada sistema utilizando operaciones 
elementales de fila sobre las ecuaciones o sobre la matriz aumentada. 
Siga el procedimiento de eliminación sistemático explicado en esta 
sección. 


10 . 


1 

0 

o 

o 


3 

1 

0 

0 


0 -2 -7 

0 3 6 

1 0 2 

0 1 —2 


1. x¡ + 5x2 = 7 2. 3.\'i + 6.v 2 = —3 

— 2xi — 1x2 = —5 5.\'i + lx 2 = 10 

3. Encuentre el punto (xi, x 2 ) que pertenece tanto a la recta X\ 4 
2x2 — 4 como a la recta x\ — x 2 = 1. Observe la figura. 


En los ejercicios 11 a 14 resuelva los sistemas. 

11. x 2 + 5x 3 = —4 

Xi 4- 4 x 2 + 3x 3 = —2 
2xi 4" 7x 2 4~ x 3 — —2 


*2 



\ / * 

1 

11 


+ 2x 2 = 4 


4. Obtenga el punto de intersección de las rectas x\ 4 2x 2 = —13 
y 3xi — 2 .X 2 = 1 • 


12. xi — 5 x 2 + 4x 3 = —3 
2xi — 1x2 4- 3x 3 = —2 

—2.y ] 4~ x 2 4~ 7x 3 — —1 

13. x'i — 3x 3 = 8 

2xi 4- 2x 2 4- 9 x 3 = 7 

X‘2 4- 5x3 = —2 

14. 2xi — 6 x 3 = —8 

x 2 4- 2x 3 = 3 

3xi 4- 6 x 2 — 2x 3 = —4 


En los ejercicios 5 y 6 considere que cada matriz es la matriz aumen¬ 
tada de un sistema lineal. Exprese con palabras las siguientes dos 
operaciones elementales de fila que deben realizarse para resolver 
el sistema. 

' 1 -4 -3 0 7' 

0 14 0 6 

' 0 0 10 2 

_0 0 0 1 -5_ 

'1-6 4 0-1" 

0 2 -7 0 4 

0 0 1 2-3 

0 0 4 1 2 


En los ejercicios 15 y 16 determine si los sistemas son consistentes. 
No resuelva por completo dichos sistemas. 

15. xi — 6 x 2 = 5 

x 2 — 4 X 3 4- X 4 = 0 
—xi 4- 6 x 2 4- X 3 4- 5x 4 = 3 
—x 2 4- 5x3 4- 4x 4 = 0 

16. 2xi — 4x 4 = —10 

3x 2 4- 3x 3 = 0 

x 3 4- 4 x 4 = —1 
—3x'i 4- 2x 2 4- 3x 3 4- x 4 = 5 


En los ejercicios 7 a 10. la matriz aumentada de un sistema lineal 
se redujo mediante operaciones de fila a la forma indicada. En cada 
caso, continúe con las operaciones adecuadas de fila y describa el 
conjunto solución del sistema original. 

"1 7 3 -4' 

0 1-13 

■ 0 0 0 1 

0 0 1-2 


17. ¿Las tres rectas 2x'i 4 3x 2 = — 1,6x'i 4 5x 2 = 0, y 2x 4 — 5x 2 = 7 
tienen un punto común de intersección? Explique su respuesta. 

18. Diga si los tres planos 2x 4 4 4x 2 4 4x 3 = 4, x 2 — 2x 3 = —2, y 
2xi 4 3x 2 = 0 tienen al menos un punto común de intersección. 
Explique su respuesta. 

En los ejercicios 19 a 22, determine el valor o los valores de h 
tales que la matriz sea la matriz aumentada de un sistema lineal 
consistente. 


" 1 

-5 

4 

0 

0 " 

19. 

" 1 

h 

4" 

© 

1 1 

0 

1 

0 

1 

0 

_ 3 

6 

8 _ 

0 

0 

3 

0 

0 


' 1 

4 

-2' 

r 

0 

0 

0 

2 

0 

21. 

_ 3 

h 

-6 

l 


1 

2 

-4 

2 


h —5 
-8 6 _ 

12 h 
—6 -3 


1-1 0 0-5 

0 1-2 0-7 

0 0 1-32 

0 0 0 1 4 


En los ejercicios 23 y 24, se citan enunciados clave de esta sección, 
con ligeras modificaciones (pero manteniendo su validez), o se al¬ 
teraron de manera que, en algunos casos, son falsos. Marque cada 
enunciado como verdadero o falso, y justifique su respuesta. (Si el 
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enunciado es verdadero, entonces indique la ubicación aproximada 
donde se presenta un enunciado similar, o haga referencia a una defi¬ 
nición o un teorema. Si la afirmación es falsa, indique la ubicación 
de un enunciado que se haya citado o empleado incorrectamente, 
o cite un ejemplo que muestre la falsedad del enunciado en todos 
los casos). Preguntas similares de falso/verdadero se presentarán en 
muchas secciones del libro. 

23. a) Todas las operaciones elementales de fila son reversibles. 
tí) Una matriz de 5 x 6 tiene seis filas. 

c) El conjunto solución de un sistema lineal que incluye a las 
variables xi,..., x„ es una lista de números («i,..., s„) que 
da validez a cada ecuación del sistema cuando se sustitu¬ 
yen los valores si,..., s„ por x\,.. ., x n , respectivamente. 

d) Las dos preguntas fundamentales acerca de un sistema lineal 
incluyen existencia y unicidad. 

24. a) Dos matrices son equivalentes por filas si tienen el mismo 

número de filas. 

tí) En una matriz aumentada, las operaciones elementales de 
fila no modifican nunca el conjunto solución del sistema li¬ 
neal asociado. 

c) Dos sistemas lineales equivalentes pueden tener diferentes 
conjuntos solución. 

d) Un sistema consistente de ecuaciones lineales tiene una o 
más soluciones. 

25. Encuentre una ecuación que incluya a g, h y k, y que permita 
que esta matriz aumentada corresponda a un sistema consis¬ 
tente: 

'1-4 7 g~ 

0 3-5 h 

-2 5-9 k _ 

26. Suponga que el sistema que aparece a continuación es consis¬ 
tente para todos los posibles valores de / y g. ¿Qué puede decir¬ 
se acerca de los coeficientes c y di Justifique su respuesta. 

2*1 + 4.Y2 = / 

ex i + dx 2 = g 


En los ejercicios 29 a 32, encuentre la operación elemental de fila 
que transforme a la primera matriz en la segunda, y luego encuentre 
la operación de fila inversa que transforme a la segunda matriz en la 
primera. 



'0-2 5 


"3-1 6 

29. 

1 3 -5 

, 

1 3 -5 


u> 

1 


O 

1 

N> 

QQ 


'1 3-4" 


' 1 3-4 

30. 

0-2 6 

, 

0-2 6 


0 -5 10 


O 

1 

LO 



' 1 

-2 

1 

0" 


' 1 

-2 

1 

0 ' 

31. 

0 

5 

-2 

8 

, 

0 

5 

-2 

8 


4 

-1 

3 

—6 _ 


L 

0 

7 

-1 

-6 


' 1 

2 

-5 

0 



■ 1 

2 

-5 

0 

32. 

0 

1 

-3 

-2 

, 

0 

1 

-3 

-2 


0 

4 

-12 

7 _ 


0 

0 

0 

15 


Un importante asunto en el estudio de transferencia de calor es deter¬ 
minar la distribución de temperatura de estado estable de una placa 
delgada cuando se conoce la temperatura en los bordes. Suponga que 
la placa que se ilustra en la figura representa una sección transversal 
de una viga de metal, con flujo de calor despreciable en la dirección 
perpendicular a la placa. Sean Tu..., Tu las temperaturas en los cua¬ 
tro nodos interiores de la malla en la figura. La temperatura en un 
nodo es aproximadamente igual al promedio de las temperaturas de 
los cuatro nodos más cercanos, esto es, a la izquierda, arriba, a la 
derecha y abajo. 3 Por ejemplo. 

Ti = (10 + 20 + T 2 + T 4 )/ 4, o 47) - 73 - T 4 = 30 


20 ° 20 ° 



1 

2 


4 

3 





40° 

40° 


30° 30° 


27. Suponga que a, b, c y d son constantes tales que a es diferente 
de cero y el sistema que aparece a continuación es consisten¬ 
te para todos los posibles valores de / y g. ¿Qué podría decir 
acerca de los números a, b, c y di Justifique su respuesta. 

ax i + bx 2 = / 
ex i + dx 2 = g 

28. Construya tres diferentes matrices aumentadas para los sistemas 
lineales cuyo conjunto solución es X\ = 3, x% = — 2, X 3 = —1. 


33. Escriba un sistema de cuatro ecuaciones cuya solución dé esti¬ 
maciones de las temperaturas Ti,..., 7). 

34. Resuelva el sistema de ecuaciones del ejercicio 33. [Sugerencia: 
Para conseguir rapidez en el cálculo, intercambie las filas 1 y 4 
antes de iniciar las operaciones de “remplazo”]. 


3 Véase Frank M. White, Heat and Mass Transfer (Reading, MA: Addison- 
Wesley Publishing, 1991). pp. 145-149. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. a) Para efectuar “cálculos a mano”, la mejor elección es intercambiar las ecuaciones 3 
y 4. Otra posibilidad es multiplicar la ecuación 3 por 1/5. O bien, remplazar la ecua¬ 
ción 4 por su suma con la fila 3 multiplicada por —1/5. (En cualquier caso, no utilice 
X 2 en la ecuación 2 para eliminar 4^2 en I a ecuación 1. Espere hasta que se haya lo¬ 
grado una forma triangular y los términos X 3 y x 4 se hayan eliminado de las primeras 
dos ecuaciones). 
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CAPITULO 1 


Ecuaciones lineales en álgebra lineal 



Como (3, 4, —2) satisface las dos 
primeras ecuaciones, está sobre 
la recta de intersección de los 
primeros dos planos. Puesto que 
(3, 4, —2) no satisface las tres 
ecuaciones, se concluye que no 
pertenece a los tres planos. 


b ) El sistema tiene forma triangular. La simplificación ulterior inicia con X 4 en la cuarta 
ecuación. Utilice X 4 para eliminar todos los términos X 4 sobre ella. Ahora el paso 
adecuado es sumar la ecuación 4, multiplicada por 2, a la ecuación 1. (Luego, vaya 
a la ecuación 3 y multiplíquela por 1/2, y después utilice la ecuación para eliminar 
los términos x 3 sobre ella). 

2. El sistema correspondiente a la matriz aumentada es 

x¡ + 5xo + 2 x 3 = —6 
4x2 — 7 .X 3 = 2 

5x3 = 0 

La tercera ecuación hace X 3 = 0, el cual, desde luego, es un valor permitido para X 3 . Des¬ 
pués de eliminar los términos X 3 en las ecuaciones 1 y 2 , se podría continuar para obtener 
valores únicos de xi y X 2 . Así que existe una solución, y es única. Esta situación contrasta 
con la del ejemplo 3. 

3. Es fácil comprobar si una lista específica de números es una solución. Sean xi = 3, 
X 2 = 4, y X 3 = —2, y encuentre que 

5(3) - (4) + 2(—2) = 15- 4 - 4 = 7 

—2(3) + 6(4) + 9(—2) = -6 + 24 - 18 = 0 
-7(3) + 5(4) - 3(—2) = -21 + 20 + 6 = 5 

Aunque las primeras dos ecuaciones se satisfacen, no sucede lo mismo con la tercera, 
por lo que (3, 4, —2) no es una solución del sistema. Observe cómo se utilizan los parén¬ 
tesis cuando se realizan las sustituciones; su uso es muy recomendable para protegerse 
contra errores aritméticos. 

4. Cuando la segunda ecuación se remplaza por su suma con la primera ecuación multipli¬ 
cada por 3, el sistema se convierte en: 

2xi — X 2 = h 

0 = k + 3/7 


Si k + 3 h es diferente de cero, el sistema no tiene solución. El sistema es consistente para 
cualesquiera valores de h y k que produzcan k + 3h = 0. 


1.2 


REDUCCIÓN POR FILAS Y FORMAS ESCALONADAS 


En esta sección se perfecciona el método de la sección 1.1 para obtener un nuevo algoritmo 
de reducción por filas que permitirá analizar cualquier sistema de ecuaciones lineales. 1 Las 
preguntas fundamentales de existencia y unicidad planteadas en la sección 1.1 podrán res¬ 
ponderse utilizando la primera parte del algoritmo. 

El algoritmo es aplicable a cualquier matriz, sin importar si esta se considera o no como 
la matriz aumentada de un sistema lineal. Así, la primera parte de esta sección se ocupa de 
una matriz rectangular arbitraria y empieza introduciendo dos importantes clases de matrices, 
que incluyen a las matrices “triangulares” de la sección 1.1. En las definiciones que siguen, 
una fila o columna distinta de cero (o no nula ) de una matriz será una fila o columna que 
contenga al menos un elemento diferente de cero; una entrada principal de una fila se refiere 
a la entrada o el elemento diferente de cero que se encuentra más a la izquierda (en una fila 
distinta de cero). 


1 El algoritmo es una variante de lo que se conoce comúnmente como eliminación gaussiana. Un método de elimi¬ 
nación similar para sistemas lineales fue utilizado por matemáticos chinos en el año 250 a. C. El proceso era des¬ 
conocido en la cultura occidental hasta el siglo xix, cuando el famoso matemático alemán. Cari Friedrich Gauss, 
lo descubrió. El ingeniero alemán, Wilhelm Jordán, dio a conocer el algoritmo en un libro sobre geodesia publicado 
en 1888. 
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DEFINICIÓN 


Una matriz rectangular está en forma escalonada (o forma escalonada por filas) si 
tiene las siguientes tres propiedades: 

1. Todas las diferentes de cero están arriba de las filas que solo contienen ceros. 

2. Cada entrada principal de una fila está en una columna a la derecha de la entrada 
principal de la fila superior. 

3. En una columna todas las entradas debajo de la entrada principal son ceros. 

Si una matriz de forma escalonada satisface las siguientes condiciones adicionales, en¬ 
tonces está en forma escalonada reducida (o forma escalonada reducida por filas): 

4. La entrada principal en cada fila diferente de cero es 1. 

5. Cada entrada principal 1 es la única entrada distinta de cero en su columna. 


Una matriz escalonada (o bien, una matriz escalonada reducida) está en forma de 
escalón (o en forma escalonada reducida, respectivamente). La propiedad 2 dice que las en¬ 
tradas principales forman un patrón escalonado (esto es, en forma de escalera) que avanza 
hacia abajo y hacia la derecha de la matriz. La propiedad 3 es una simple consecuencia de 
la propiedad 2, pero se incluyó para darle mayor énfasis. 

Las matrices “triangulares” de la sección 1.1, tales como 


"2 

-3 

2 

1 


" i 

0 

0 

29" 

0 

1 

-4 

8 

y 

0 

1 

0 

16 

0 

0 

0 

5/2 _ 


0 

0 

1 

3 


están en forma escalonada. De hecho, la segunda matriz está en forma escalonada reducida. 
A continuación se presentan más ejemplos. 


EJEMPLO 1 Las siguientes matrices están en forma escalonada. Las entradas principales 
(■) pueden tener cualquier valor diferente de cero; las entradas con asterisco (*) pueden tener 
cualquier valor (incluyendo al cero). 

r _ _i |" o ■ * * * * * * * * 

00 ******* 
000 ****** 
0000 »**** 
0000000 »* 


o 

o 


* 

o 

o 


Las siguientes matrices están en forma escalonada reducida porque las entradas principales 
son números 1, y hay ceros abajo y arriba de cada entrada principal 1. 


10 ** 
0 1 ** 
0 0 0 0 

0 0 0 0 


0 

1 

* 

0 

0 

0 

* 

* 

0 

* 

0 

0 

0 

1 

0 

0 

* 

* 

0 

* 

0 

0 

0 

0 

1 

0 

* 

* 

0 

* 

0 

0 

0 

0 

0 

1 

* 

* 

0 

* 

0 

0 

0 

0 

0 

0 

0 

0 

1 

* 


Cualquier matriz distinta de cero puede reducirse por filas (es decir, transformarse 
mediante operaciones elementales de fila) para producir más de una matriz en forma escalo¬ 
nada, utilizando diferentes secuencias de operaciones de fila. Sin embargo, la forma escalona¬ 
da reducida que se obtiene a partir de una matriz es única. El siguiente teorema se demuestra 
en el apéndice A al final del libro. 


Unicidad de la forma escalonada reducida 

Cada matriz es equivalente por filas a una, y solo a una, matriz escalonada reducida. 


TEOREMA 1 
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Ecuaciones lineales en álgebra lineal 


DEFINICIÓN 


Si una matriz A es equivalente por filas a una matriz escalonada U, entonces U se llama 
una forma escalonada (o una forma escalonada por filas) de A; si U está en forma escalo¬ 
nada reducida, entonces U es la forma escalonada reducida de A. [La mayoría de los pro¬ 
gramas de matrices y de las calculadoras con capacidades para trabajar con matrices emplean 
la abreviatura RREF (por las siglas de reduced row echelon forrri) para referirse a la forma 
escalonada reducida por filas. Algunos utilizan REF (por las siglas de row echelon forrri) para 
designar la forma escalonada por filas]. 

Posiciones pivote 

Cuando las operaciones de fila sobre una matriz producen una forma escalonada, las opera¬ 
ciones de fila posteriores para obtener la forma escalonada reducida no cambian la posición 
de las entradas principales. Como la forma escalonada reducida es única, entonces las en¬ 
tradas principales siempre están en las mismas posiciones en cualquier forma escalonada 
obtenida a partir de una matriz dada. Esas entradas principales corresponden a los números 
1 principales de la forma escalonada reducida. 

Una posición pivote en una matriz A es una ubicación en A que corresponde a un 1 
principal en la forma escalonada reducida de A. Una columna pivote es una columna 
de A que contiene una posición pivote. 


En el ejemplo 1, los cuadrados (■) identifican las posiciones pivote. Muchos conceptos 
fundamentales en los primeros cuatro capítulos estarán relacionados de una u otra manera con 
las posiciones pivote en una matriz. 


EJEMPLO 2 Reduzca por filas la matriz A que se muestra a continuación hasta la forma 
escalonada, y localice las columnas pivote de A. 

" 0 -3 -6 4 9" 

-1-2-1 3 1 

A ~ -2 -3 0 3 -1 

1 4 5-9-7 


SOLUCIÓN Utilice la misma estrategia básica de la sección 1.1. La entrada superior de la co¬ 
lumna diferente de cero más a la izquierda de la matriz es la primera posición pivote. En esta posi¬ 
ción debe colocarse una entrada diferente de cero, o pivote. Una buena opción es intercambiar 
las filas 1 y 4 (porque los cálculos mentales en el siguiente paso no implicarán fracciones). 


1- 4 

Pivote 

5 ■ 

-9 

-7 

-1 -2 

-1 

3 

1 

-2 -3 

0 

3 

-1 

O 

1 

-6 

4 

9 


Columna pivote 


Cree ceros debajo del pivote, 1, sumando múltiplos de la primera fila a las filas inferiores, 
para así obtener la matriz (1) que se muestra a continuación. La posición pivote en la segunda 
fila debe estar tan a la izquierda como sea posible, es decir, en la segunda columna. Se elige 
el 2 en esta posición como el siguiente pivote. 


1 

0 

0 

0 


4 
2 

5 
-3 


— Pivote 
5 -9 

4 -6 

10 -15 
-6 4 


-7 

-6 

-15 


9 


( 1 ) 


Siguiente columna pivote 
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Sume la fila 2 multiplicada por —5/2 a la fila 3, y sume la fila 2 multiplicada por 3/2 a la 
fila 4. 


1 4 5-9-7 

0 2 4 -6 -6 

0 0 0 0 0 

0 0 0 -5 0 


( 2 ) 


La matriz en (2) es diferente de las que se incluyen en la sección 1.1. ¡No hay manera de crear 
una entrada principal en la columna 3! (No podemos emplear las filas 1 o 2 porque, al hacer¬ 
lo, se destruiría el arreglo escalonado de las entradas principales ya obtenidas). Sin embargo, 
si se intercambian las filas 3 y 4, se puede obtener una entrada principal en la columna 4. 


Pivote 


' 1 

4 

5 

-9 

-7 


■ 

* 

* 

* 

* 

0 

2 

4 

-6 

-6 


0 

■ 

* 

* 

* 

0 

0 

0 


0 

Forma general: 

0 

0 

0 

■ 

* 

0 

0 

0 

0 

0 


0 

0 

0 

0 

0 _ 


Columnas pivote 


La matriz está en forma escalonada y así revela que las columnas 1, 2 y 4 de A son columnas 
pivote. 


A = 





0-/-3 

-6 4 

9 


■1 —2-*- 

-1 3 

1 


■2 -3 

0 3- 

-1 


1 4 

5 -9 

-7 



_ 4 


Posiciones pivote 


Columnas pivote 


(3) 


Un pivote, como el que se muestra en el ejemplo 2, es un número distinto de cero en una 
posición pivote que se utiliza conforme se necesite crear ceros mediante operaciones de fila. 
Los pivotes en el ejemplo 2 fueron 1, 2 y —5. Observe que esos números no son los mismos 
que los elementos reales de A en las posiciones pivote indicadas en (3). 

Con el ejemplo 2 como guía, es posible describir un procedimiento eficiente para trans¬ 
formar una matriz en una matriz escalonada o escalonada reducida. El estudio cuidadoso y el 
dominio de este procedimiento rendirán valiosos frutos en este curso. 


Algoritmo de reducción por filas 

El algoritmo que sigue consta de cuatro pasos y produce una matriz en forma escalonada. 
Un quinto paso da por resultado una matriz en forma escalonada reducida. Demostraremos 
este algoritmo con un ejemplo. 

EJEMPLO 3 Aplique operaciones elementales de fila para transformar la siguiente ma¬ 
triz a la forma escalonada y, luego, a la forma escalonada reducida: 

"0 3 -6 6 4 -5" 

3-7 8-58 9 
3 -9 12 -9 6 15 


SOLUCIÓN 


PASO 1 

Se inicia con la columna diferente de cero del extremo izquierdo. Esta es una columna 
pivote. La posición pivote se ubica en la parte superior. 
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0 3-66 

4 

-5 

3-7 8-5 

8 

9 

3 -9 12 -9 

6 

15 

^— Columna pivote 




PASO 2 

Seleccione como pivote una entrada diferente de cero en la columna pivote. Si es nece¬ 
sario, intercambie filas para mover esta entrada a la posición pivote. 


Intercambie a las filas 1 y 3. (O bien, también se podrían intercambiar las filas 1 y 2). 



-9 

-5 

6 


6 15 

8 9 

4 -5 


PASO 3 

Utilice operaciones de remplazo de filas para crear ceros en todas las posiciones ubi¬ 
cadas debajo del pivote. 


Como paso preliminar, se podría dividir la fila superior entre el pivote, 3. Pero con dos núme¬ 
ros 3 en la columna 1, esto es tan fácil como sumar la fila 1 multiplicada por — 1 a la fila 2. 


i— Pivote 




3 -9 12 

-9 

6 

15 

0 2-4 

4 

2 

-6 

0 3-6 

6 

4 

-5 


PASO 4 

Cubra (o ignore) la fila que contiene la posición pivote y cubra todas las filas, si las hay, 
por encima de esta. Aplique los pasos 1 a 3 a la submatriz restante. Repita el proceso 
hasta que no haya filas diferentes de cero por modificar. 


Con la fila 1 cubierta, el paso 1 muestra que la columna 2 es la próxima columna pivote; para 
el paso 2, seleccione como pivote la entrada “superior” en esa columna. 

i— Pivote 

"3 -9 12 -9 6 15" 

0 2- -4 4 2-6 

0 3 -6 6 4 -5 

1 — Siguiente columna pivote 

En el paso 3, se podría insertar un paso adicional de dividir la fila “superior” de la submatriz 
entre el pivote, 2. En vez de ello, se suma la fila “superior” multiplicada por —3/2 a la fila 
de abajo. Esto produce 

"3 -9 12 -9 6 15~ 

0 2 -4 4 2 -6 

0 0 0 0 1 4 
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Para el paso 4, cuando se cubre la fila que contiene la segunda posición pivote, se obtiene una 
nueva submatriz con una sola fila: 


"3 

-9 

12 

-9 

6 

15" 

0 

2 

-4 

4 

2 

-6 

0 

0 

0 

0 

1^ 

1 4 


Los pasos 1 a 3 no necesitan aplicarse para esta submatriz, pues ya se ha alcanzado una forma 
escalonada para la matriz completa. Si se desea la forma escalonada reducida, se efectúa un 
paso más. 


PASO 5 

Empezando con la posición pivote del extremo derecho y trabajando hacia arriba y 
hacia la izquierda, genere ceros arriba de cada pivote. Si un pivote no es 1, conviértalo 
en 1 mediante una operación de escalamiento. 


El pivote del extremo derecho está en la fila 3. Genere ceros sobre él, sumando múltiplos 
adecuados de la fila 3 a las filas 1 y 2. 

"3 -9 12 -9 0 -9 

0 2 -4 4 0 -14 

0 0 0 0 1 4 


-•—Fila 1 + (-6) • fila 3 
Fila 2 + (-2) • fila 3 


El siguiente pivote se encuentra en la fila 2. Se escala esta fila dividiéndola entre el pivote. 


3 -9 12 -9 0 -9 

0 1 -2 2 0 -7 

0 0 0 0 1 4 


■*— Fila escalada 


por 


y 

2 


Cree un cero en la columna 2 sumando la fila 2 multiplicada por 9 a la fila 1. 


3 0 -6 9 0 -72 

0 1 -2 2 0 -7 

0 0 0 0 1 4 


Fila 1 + (9) • fila 2 


Finalmente, escale la fila 1 dividiéndola entre el pivote, 3. 


1 0 -2 3 0 -24 

0 1 -2 2 0 -7 

0 0 0 0 1 4 


Fila escalada 


por 


y 

3 


Esta es la forma escalonada reducida de la matriz original. ■ 

La combinación de los pasos 1 a 4 se conoce como fase progresiva del algoritmo de 
reducción por filas. El paso 5, que produce la única forma escalonada reducida, se conoce 
como fase regresiva. 


- NOTA NUMÉRICA - 

En el paso 2 que se describió antes, un programa computacional por lo general selec¬ 
ciona como pivote a la entrada en una columna que tenga el mayor valor absoluto. Esta 
estrategia, llamada pivoteo parcial, se utiliza porque reduce los errores de redondeo 
en los diversos cálculos. 
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Soluciones de sistemas lineales 

El algoritmo de reducción por filas conduce directamente a una descripción explícita del 
conjunto solución de un sistema lineal cuando se aplica a la matriz aumentada del sistema. 

Suponga, por ejemplo, que la matriz aumentada de un sistema lineal se transformó a la 
forma escalonada reducida equivalente 

"1 0-5 1" 

0 114 

0 0 0 0 


Existen tres variables porque la matriz aumentada tiene cuatro columnas. El sistema de 
ecuaciones asociado es 


X\ — 5X3 = 1 

X 2 + X 3 = 4 

0 = 0 


(4) 


Las variables xi y X 2 correspondientes a las columnas pivote se conocen como variables bá¬ 
sicas 2 . La otra variable, X 3 , se denomina variable libre. 

Siempre que un sistema es consistente, como en (4), el conjunto solución se puede des¬ 
cribir explícitamente al despejar en el sistema de ecuaciones reducido las variables básicas 
en términos de las variables libres. Esta operación es posible porque la forma escalonada 
reducida coloca a cada variable básica en una y solo una ecuación. En (4), despeje xi de la 
primera ecuación y X 2 de la segunda. (Ignore la tercera ecuación, ya que no ofrece restric¬ 
ciones sobre las variables). 

Xi = 1 4- 5x3 

■ x 2 = 4 - x 3 (5) 

X 3 es libre 


El enunciado “X 3 es libre” significa que existe libertad de elegir cualquier valor para X 3 . 
Una vez hecho esto, las fórmulas en (5) determinan los valores de X\ y X 2 . Por ejemplo, cuando 
X 3 = 0, la solución es (1, 4, 0); cuando X 3 = 1, la solución es ( 6 , 3, 1). Cada asignación 
diferente de X 3 determina una solución (distinta) del sistema, y cada solución del sistema 
está determinada por una asignación de X 3 . 


EJEMPLO 4 Encuentre la solución general del sistema lineal cuya matriz aumentada se 
redujo a 

"1 6 2 -5 -2 -4" 

0 0 2 -8 -1 3 

0 0 0 0 1 7 

SOLUCION La matriz está en forma escalonada, pero se desea la forma escalonada reducida 
antes de despejar las variables. El siguiente paso es completar la reducción por filas. El sím¬ 
bolo ~ antes de una matriz indica que esta es equivalente por filas a la matriz anterior. 


■ 1 

6 

2 

-5 

-2 

-4" 


1 

6 

2 

-5 

0 

10 " 

0 

0 

2 

-8 

-1 

3 


0 

0 

2 

-8 

0 

10 

0 

0 

0 

0 

1 

7 


0 

0 

0 

0 

1 

7 

" 1 

6 

2 

-5 

0 

10 " 


" 1 

6 

0 

3 

0 

0 " 

0 

0 

1 

-4 

0 

5 


0 

0 

1 

-4 

0 

5 

0 

0 

0 

0 

1 

7 


0 

0 

0 

0 

1 

7 


2 Algunos libros utilizan el término variables principales , ya que corresponden a las columnas que contienen entradas 
principales. 
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Existen cinco variables poique la matriz aumentada tiene seis columnas. Ahora el sistema 
asociado es 

X\ + 6 x 2 + 3x4 = 0 

x 3 - 4x 4 = 5 ( 6 ) 

x 5 = 7 

Las columnas pivote de la matriz son 1, 3 y 5, así que las variables básicas son xi, x 3 y X 5 . Las 
variables restantes, X 2 y x 4 , deben ser libres. Se despejan las variables básicas para obtener 
la solución general: 

xi = — 6 x 2 — 3x 4 
X 2 es libre 

• x 3 = 5 4- 4x 4 (7) 

X 4 es libre 
x 5 = 7 

Observe que el valor de X 5 ya estaba establecido por la tercera ecuación del sistema ( 6 ). ■ 

Descripciones paramétricas de conjuntos solución 

Las descripciones en (5) y (7) son descripciones paramétricas de conjuntos solución en los 
cuales las variables libres actúan como parámetros. Resolver un sistema significa encontrar 
una descripción paramétrica del conjunto solución o determinar que el conjunto solución está 
vacío. 

Siempre que un sistema sea consistente y tenga variables libres, el conjunto solución ten¬ 
drá muchas descripciones paramétricas. Por ejemplo, en el sistema (4), se puede sumar la ecua¬ 
ción 2 multiplicada por 5 a la ecuación 1 para obtener el sistema equivalente 

x'i + 5x2 = 21 

x 2 + x 3 = 4 

Se podría tratar a x 3 como un parámetro y despejar x¡ y x 3 en términos de X 2 , y se tendría una 
descripción exacta del conjunto solución. Sin embargo, para ser consistentes, se establece 
la convención (arbitraria) de utilizar siempre las variables libres como parámetros para des¬ 
cribir un conjunto solución. (La sección de respuestas al final del libro también refleja esta 
convención). 

Cuando un sistema es inconsistente, el conjunto solución es un conjunto vacío, aun cuan¬ 
do el sistema tenga variables libres. En este caso, el conjunto solución no tiene representación 
paramétrica. 

Sustitución regresiva 

Considere el siguiente sistema, cuya matriz aumentada está en forma escalonada, pero no en 
forma escalonada reducida: 


Xi — 7x 2 + 2x 3 — 5x 4 + 8 x 5 = 10 
x 2 — 3x 3 + 3x 4 -I- X 5 = —5 
x 4 — x 5 = 4 

Un programa computacional resolvería este sistema mediante sustitución regresiva, en vez 
de calcular la forma escalonada reducida. Es decir, el programa despejaría x 4 de la ecuación 
3 en términos de X 5 , y sustituiría la expresión para x 4 en la ecuación 2; luego, despejaría X 2 de 
esta última, sustituiría las expresiones para X 2 y x 4 en la ecuación 1 y despejaría x\. 

Nuestro formato matricial para la fase regresiva de reducción por filas, el cual produce la 
forma escalonada reducida, tiene el mismo número de operaciones aritméticas que la sustitu¬ 
ción regresiva. Pero la disciplina del formato matricial reduce de forma sustancial los errores 
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posibles en los cálculos a mano. ¡La mejor estrategia es utilizar solamente la forma escalo¬ 
nada reducida para resolver un sistema! La Guía de estudio que acompaña a este libro ofrece 
varias sugerencias útiles para efectuar operaciones de fila de manera exacta y rápida. 


- NOTA NUMÉRICA - 

En general, la fase progresiva de reducción por filas es más larga que la fase regre¬ 
siva. Por lo regular, un algoritmo para resolver un sistema se mide en flops (u ope¬ 
raciones de punto flotante). Un flop es una operación aritmética ( + , —, *, /) que se 
realiza sobre dos números reales de punto flotante . 3 Para una matriz de n x (n + 1), 
la reducción a la forma escalonada puede requerir 2n 3 /3 + n 2 /2 — ln/6 flops (que 
es aproximadamente 2 « 3 /3 flops cuando n es moderadamente grande, por ejemplo, 
n > 30). En contraste, una reducción adicional a la forma escalonada reducida nece¬ 
sita, a lo sumo, n 2 flops. 


Preguntas de existencia y unicidad 

Aunque una forma escalonada no reducida es una herramienta poco eficiente para resolver 
un sistema, esta forma es justamente el medio correcto para responder las dos preguntas fun¬ 
damentales planteadas en la sección 1 . 1 . 


EJEMPLO 5 Determine la existencia y unicidad de las soluciones del sistema 

3.T2 — 6x3 + 6x4 + 4 x 5 = — 5 
3 xi — 7.X2 + 8x3 — 5 x' 4 + 8x5 = 9 
3 xi — 9x2 4- I 2 .X 3 — 9 x'4 + 6x5 = 15 


SOLUCIÓN La matriz aumentada de este sistema se redujo por filas en el ejemplo 3 a: 


3 -9 12 -9 6 15 

0 2 -4 4 2 -6 

0 0 0 0 1 4 


( 8 ) 


Las variables básicas son xi, X 2 y X 5 ; las variables libres son X 3 y X 4 . No existe ninguna ecua¬ 
ción del tipo 0=1 que indique la inconsistencia del sistema, así que se podría emplear sus¬ 
titución regresiva para encontrar una solución. Pero en ( 8 ) ya es evidente la existencia de 
una solución. Además, la solución no es única porque hay variables libres. Cada diferente 
asignación de X 3 y X 4 determina una solución distinta. Por lo tanto, el sistema tiene un nú¬ 
mero infinito de soluciones. ■ 

Cuando un sistema está en forma escalonada y no contiene ecuaciones del tipo 0 = b, 
con b diferente de cero, entonces cada ecuación no nula tiene una variable básica con un 
coeficiente distinto de cero. Es posible que las variables básicas estén completamente de¬ 
terminadas (sin variables libres) o que al menos una de las variables básicas pueda expresarse 
en términos de una o más variables libres. En el primer caso, existe una solución única; en el 
último caso, hay infinidad de soluciones (una para cada asignación de valores a las variables 
libres). 


3 Tradicionalmente, un flop era solo una multiplicación o división, ya que la suma y la resta tomaban mucho menos 
tiempo y podían ignorarse. Ahora se prefiere la definición de flop que aquí se presenta, debido a los avances en la 
arquitectura computacional. Véase Golub y Van Loan, Matrix Computations, 2a. ed. (Baltimore: The Johns Hopkins 
Press, 1989), pp. 19-20. 
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Esas observaciones justifican el siguiente teorema. 

TEOREMA 2 Teorema de existencia y unicidad 

Un sistema lineal es consistente si y solo si la columna más a la derecha de la matriz 
aumentada no es una columna pivote, es decir, si y solo si una forma escalonada de 
la matriz aumentada no tiene filas del tipo 

[0 • • • 0 b] con b diferente de cero 

Si un sistema lineal es consistente, entonces el conjunto solución contiene: i. una única 
solución, cuando no existen variables libres, o ii. una infinidad de soluciones, cuando 
hay al menos una variable libre. 


El siguiente procedimiento indica cómo encontrar y describir todas las soluciones de un 
sistema lineal. 


USO DE LA REDUCCIÓN POR FILAS PARA RESOLVER UN SISTEMA LINEAL 

1. Escriba la matriz aumentada del sistema. 

2. Emplee el algoritmo de reducción por filas para obtener una matriz aumentada 
equivalente en forma escalonada. Determine si el sistema es consistente o no. Si no 
existe solución, deténgase; en caso contrario, continúe con el siguiente paso. 

3. Prosiga con la reducción por filas para obtener la forma escalonada reducida. 

4. Escriba el sistema de ecuaciones correspondiente a la matriz obtenida en el 
paso 3. 

5. Rescriba cada ecuación no nula del paso 4 de manera que su única variable básica 
se exprese en términos de cualquiera de las variables libres que aparecen en la 
ecuación. 


PROBLEMAS DE PRÁCTICA 

1. Encuentre la solución general del sistema lineal cuya matriz aumentada es 

'1 -3 -5 0' 

0 113 

2. Obtenga la solución general del sistema 

X'i — 2X2 — *3 + 3x 4 = 0 

—2x\ + 4 x 2 + 5 .T 3 — 5 x 4 = 3 
3xi — 6 x 2 — 6 x 3 4- 8 x 4 = 2 


1.2 EJERCICIOS 


En los ejercicios 1 y 2, determine cuáles matrices están en forma es¬ 
calonada reducida y cuáles se encuentran solo en forma escalonada. 


' 1 

0 

0 

0 " 


' 1 

0 

1 

0 ~ 

0 

1 

0 

0 

b) 

0 

1 

1 

0 

0 

0 

1 

1 


0 

0 

0 

1 


' 1 

0 

0 

0“ 


' 1 

1 

0 

1 

1 ' 

0 

1 

1 

0 

el) 

0 

2 

0 

2 

2 

0 

0 

0 

0 

0 

0 

0 

3 

3 

0 

0 

0 

1 


0 

0 

0 

0 

4 


1 . a) 
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" 1 

0 

1 

1" 


" 1 

0 

0 

0" 


m 

* * 

2. a) 

0 

1 

1 

1 

b) 

0 

2 

0 

0 

16. a) 

0 

■ * 


0 

0 

0 

0 


0 

0 

1 

1 


0 

0 ■_ 


0 0 0 0 
12 0 0 
0 0 10 
0 0 0 1 


b) 


0 

0 


* 

0 

o 


* 


o 


d) 


o 

o 

o 

o 


1 

o 

o 

o 


1 

1 

o 

o 


1 1 
1 1 
O 1 
o o 


En los ejercicios 17 y 18, determine el valor o los valores de h tales 
que la matriz sea la matriz aumentada de un sistema lineal consis¬ 
tente. 




-3 

6 


1 

-2 


En los ejercicios 3 y 4 aplique la reducción por filas a las matrices 
para llevarlas a la forma escalonada reducida. En las matrices origi¬ 
nal y final encierre en un círculo las posiciones pivote, e indique las 
columnas pivote. 


En los ejercicios 19 y 20, asigne valores para h y k de manera que 
el sistema a) no tenga solución, b) tenga solución única, y c) tenga 
muchas soluciones. Dé respuestas por separado para cada inciso. 



' 1 

2 

4 

8" 


' 1 

2 

4 

5" 

3. 

2 

4 

6 

8 

4. 

2 

4 

5 

4 


3 

6 

9 

12 


4 

5 

4 

2 


5. Describa las posibles formas escalonadas de una matriz 
de 2 x 2 diferente de cero. Utilice los símbolos ■, * y 0, como 
en la primera parte del ejemplo 1. 

6. Repita el ejercicio 5 para una matriz de 3 x 2 diferente de 
cero. 


Encuentre las soluciones generales de los sistemas cuyas matrices 
aumentadas se presentan en los ejercicios 7 a 14. 


1 

3 

4 

7" 


8. 


1 

-3 

0 

-5 

3 

9 

7 

6 



-3 

7 

0 

9 

0 

1 

—2 

3" 


10. 


1 

—2 

-1 

4 

1 

~3 

4 

-6 



—2 

4 

-5 

6 







' 1 

0 

-9 

0 

3 

—2 

4 

0' 


12. 


0 

1 

3 

0 

9 

-6 

12 

0 



0 

0 

0 

1 


6 

-4 

8 

0 



0 

0 

0 

0 







1 

-3 

0 

-1 

0 

-2" 





0 

1 

0 

0 

—4 

1 





0 

0 

0 

1 

9 

4 





0 

0 

0 

0 

0 

0 





1 

0 

-5 

0 

-8 

3" 





0 

1 

4 

-1 

0 

6 





0 

0 

0 

0 

1 

0 





0 

0 

0 

0 

0 

0 






Los ejercicios 15 y 16 emplean la notación del ejemplo 1 para ma¬ 
trices en forma escalonada. Suponga que cada matriz representa la 
matriz aumentada para un sistema de ecuaciones lineales. En cada 
caso, determine si el sistema es consistente. De ser así, determine si 
la solución es única. 


15 . 


a) 


b) 


* * * 

■ * * 

0 o 0_ 

■ * * * 
o ■ * * 

0 0-0 


19. x¡ 4- h.X 2 = 2 20. x\ — 3x2 = 1 

4xi + 8 x 2 = k 2x\ + I 1 X 2 = k 

En los ejercicios 21 y 22, marque cada enunciado como verdadero o 

falso. Justifique cada respuesta. 4 

21. a) En algunos casos, una matriz se puede reducir por filas a 

más de una matriz en forma escalonada reducida, median¬ 
te diferentes secuencias de operaciones de fila. 

b) El algoritmo de reducción por filas solamente se aplica a 
matrices aumentadas para un sistema lineal. 

c) En un sistema lineal una variable básica es una variable que 
corresponde a una columna pivote en la matriz de coefi¬ 
cientes. 

d ) Encontrar una descripción paramétrica del conjunto solución 
de un sistema lineal es lo mismo que resolver el sistema. 

e) Si una fila en una forma escalonada de una matriz aumen¬ 
tada es [0 0 0 5 0], entonces el sistema lineal asociado es 
inconsistente. 

22. a) La forma escalonada reducida de una matriz es única. 

b) Si cada columna de una matriz aumentada contiene un pivo¬ 
te, entonces el sistema correspondiente es consistente, 

c) Las posiciones pivote en una matriz dependen de si se utili¬ 
zan o no intercambios de filas en el proceso de reducción por 
filas. 

d) Una solución general de un sistema es una descripción explí¬ 
cita de todas las soluciones del sistema. 

e) Si un sistema tiene variables libres, entonces el conjunto so¬ 
lución contiene muchas soluciones. 

23. Suponga que la matriz coeficiente de un sistema lineal de cua¬ 
tro ecuaciones con cuatro variables tiene un pivote en cada co¬ 
lumna. Explique por qué el sistema tiene solución única. 

24. Suponga que un sistema de ecuaciones lineales tiene una matriz 
aumentada de 3 x 5 cuya quinta columna no es una columna 
pivote. ¿El sistema es consistente? ¿Por qué? 


4 Preguntas de verdadero/falso de este tipo se presentarán en muchas seccio¬ 
nes. Antes de los ejercicios 23 y 24 de la sección 1.1, se describieron algunos 
métodos para justificar las respuestas. 
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25. Suponga que la matriz coeficiente de un sistema de ecuacio¬ 
nes lineales tiene una posición pivote en cada fila. Explique 
por qué el sistema es consistente. 

26. Suponga que una matriz de coeficientes de 3 x 5 para un sis¬ 
tema tiene tres columnas pivote. ¿El sistema es consistente? 
¿Por qué? 

27. Restructure la última frase del teorema 2 empleando el concepto 

de columnas pivote: “Si un sistema lineal es consistente, enton¬ 
ces la solución es única si y solo si_”, 

28. En una matriz aumentada, ¿qué se necesita saber acerca de las 
columnas pivote para determinar que el sistema lineal es consis¬ 
tente y tiene una solución única? 

29. Un sistema de ecuaciones lineales con menos ecuaciones que 
incógnitas se conoce como sistema subdeterminado. ¿Tal siste¬ 
ma puede tener una solución única? Explique su respuesta. 

30. Dé un ejemplo de un sistema subdeterminado inconsistente de 
dos ecuaciones con tres incógnitas. 

31. Un sistema de ecuaciones lineales con más ecuaciones que in¬ 
cógnitas se llama sistema sobredeterminado. ¿Tal sistema puede 
ser consistente? Ilustre su respuesta con un sistema específico 
de tres ecuaciones con dos incógnitas. 

32. Considere que una matriz de n x (n + 1) se simplifica por fi¬ 
las a su forma escalonada reducida. Aproximadamente, ¿qué 
fracción del número total de operaciones (flops) está impli¬ 
cada en la fase regresiva de la reducción cuando n = 20? 
¿Y cuando n = 200? 

Suponga que los datos experimentales están representados por un 

conjunto de puntos en el plano. Un polinomio de interpolación para 

los datos es un polinomio cuya gráfica pasa por todos los puntos. 


En el ámbito científico, dicho polinomio se utiliza, por ejemplo, para 
estimar valores entre los puntos de datos conocidos. Otro uso es en 
la creación de curvas para imágenes gráficas en el monitor de las 
computadoras. Un método para construir un polinomio de interpo¬ 
lación consiste en resolver un sistema de ecuaciones lineales. 

| WEB | 

33. Encuentre el polinomio de interpolación p(t) = ao + a\t + c¡ 2 t 2 
para los datos (1, 6), (2, 15), (3, 28). Es decir, determine ao, ai 
y a 2 tales que 

a o + ¿í i (1) + £*2 (l) - = 6 
cío "b «i (2) 4 - a 2 (2)~ — 15 
ao + ííi(3) 4- a 2 (3)~ = 28 

34. [M] En un experimento de túnel de viento, la fuerza sobre un 
proyectil debido a la resistencia del aire se midió a diferentes 
velocidades: 

Velocidad (100 ft/seg) 0 2 4 6 8 10 

Fuerza (100 Ib) 0 2.90 14.8 39.6 74.3 119 

Encuentre un polinomio de interpolación para estos datos y 
estime la fuerza sobre el proyectil si este viaja a 750 ft/seg. 
Utilice p(t) — ao + a\t + a 2 t 2 + ap 3 + ap A + a¡t 5 . ¿Qué ocurre 
si usted intenta emplear un polinomio de menor grado que 5? 
(Por ejemplo, intente un polinomio cúbico). 5 


5 Los ejercicios marcados con el símbolo [M] deben trabajarse con la ayuda 
de un “programa de matrices” (esto es, un programa computacional, como 
MATLAB®, Maple™, Mathematica®, MathCad® o Derive™, o una calcu¬ 
ladora programable con capacidades matriciales, como las fabricadas por Texas 
Instruments o Hewlett-Packard). 



La solución general del sistema 
de ecuaciones es la recta de 
intersección de los dos planos. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. La forma escalonada reducida de la matriz aumentada y el sistema correspondiente son 

'1 0-2 9 "I xi -2x3 = 9 

1 1 3 _ y x 2 + X 3 = 3 

Las variables básicas son x\ y x 2 , y la solución general es 

Xi = 9 + 2 x 3 
■ x 2 = 3- x 3 
X 3 es libre 


Nota: Es esencial que la solución general describa a cada variable, con cualquier parámetro 
claramente definido. El siguiente enunciado no describe la solución: 

X\ = 9 + 2 x 3 
' x 2 = 3- X 3 

X 3 = 3 — X 2 Solución incorrecta 


Esta descripción implica que tanto x 2 como x 2 son libres, lo que desde luego no es el caso. 



24 CAPITULO 1 


Ecuaciones lineales en álgebra lineal 


2. La matriz aumentada del sistema se reduce por filas: 


1 

-2 

-1 

3 

0" 


" 1 

-2 

-1 

3 

0 

■2 

4 

5 

-5 

3 


0 

0 

3 

1 

3 

3 

-6 

-6 

8 

2 


0 

0 

-3 

-1 

2 






" 1 

-2 

-1 

3 

0 






0 

0 

3 

1 

3 






0 

0 

0 

0 

5 


Esta matriz escalonada indica que el sistema es inconsistente , porque su columna del ex¬ 
tremo derecho es una columna pivote; la tercera fila corresponde a la ecuación 0 = 5. No hay 
necesidad de realizar más operaciones de fila. Observe que en este problema es irrelevante 
la presencia de las variables libres porque el sistema es inconsistente. 


1.3 


ECUACIONES VECTORIALES 


Importantes propiedades de sistemas lineales se pueden describir mediante el concepto y la 
notación de vectores. Esta sección relaciona ecuaciones vectoriales con sistemas ordinarios 
de ecuaciones. El término vector aparece en una variedad de contextos matemáticos y físicos, 
los cuales se analizarán en el capítulo 4, “Espacios vectoriales”. Por ahora, vector significará 
una lista ordenada de números. Esta idea sencilla permite realizar, de manera rápida, intere¬ 
santes e importantes aplicaciones. 


Vectores en U 2 

Una matriz con una sola columna es un vector columna, o simplemente un vector. Ejemplos 
de vectores con dos entradas son 



3' 


'.2' 


Wi 

u = 

-1 

, V = 

.3 

, w = 




w 2 


donde w i y wi son números reales. R 2 (léase “erre dos”) denota el conjunto de todos los vec¬ 
tores con dos entradas. La R representa los números reales que aparecen como entradas en 
los vectores, y el exponente 2 indica que cada vector contiene dos entradas. 1 

Dos vectores en R 2 son iguales si y solo si sus entradas correspondientes son iguales. 

no son iguales, porque los vectores en R 2 son pares ordenados de números 

reales. 

Dados dos vectores u y v en R 2 , su suma es el vector u + v, que se obtiene al sumar 
las entradas correspondientes de u y v. Por ejemplo, 


1' 

+ 

'2' 


1 + 2' 


'3' 

-2 

5 


_ -2 + 5 _ 


3 


Considerando un vector u y un número real c, el múltiplo escalar de u por c es el vector cu, 
que se obtiene al multiplicar por c cada entrada en u. Por ejemplo, 



3' 


3' 


' 15' 

si u = 

-1 

y c = 5, entonces cu = 5 

-1 

— 

-5 



1 La mayor parte del libro se refiere a vectores y matrices que solo tienen entradas reales. Sin embargo, todas las 
definiciones y los teoremas en los capítulos 1 a 5, y en la mayor parte del resto del libro, conservan su validez si 
las entradas son números complejos. Vectores y matrices complejos surgen de manera natural en áreas como física 
e ingeniería eléctrica. 
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El número c en cu se llama escalar; se escribe en cursivas, y no en negritas, para así distin¬ 
guirlo del vector u. 

Es posible combinar las operaciones de multiplicación por un escalar y suma vectorial, 
como en el siguiente ejemplo. 


EJEMPLO 1 A partir de u = 

SOLUCIÓN 

4u = 


1 

-2 


y v = 


2 

-5 


, encuentre 4u, (— 3)v, y 4u + (— 3)v. 


(—3)v 


-6 

15 


4u + (—3)v = 


+ 


-6 

15 


-2 

7 


Algunas veces, por conveniencia (y también para ahorrar espacio), en este libro se de- 

3' 


nota un vector columna como 


-1 


en la forma (3, —1). En este caso, los paréntesis y la 


coma distinguen al vector (3, — 1) de la matriz fila 1 x 2 [3 — 1], que se representa con cor¬ 
chetes y sin coma. Así, 

3' 


-1 


^[3 - 1 ] 


porque las matrices tienen diferentes formas, aunque las entradas sean iguales. 

Descripciones geométricas de U 2 

Considere un sistema de coordenadas rectangulares en el plano. Como cada punto en el pla¬ 
no está determinado por un par ordenado de números, es posible identificar un punto geomé- 

trico (a, b) con el vector columna ^ . Así, puede considerarse a IHr como el conjunto de 

todos los puntos del plano. Véase la figura 1. 



•(2, 2) 

(2, 2) 




(-2,-1) 

X \ 

(3,-1) (-2,-1) 

(3,- 


FIGURA 1 Vectores como puntos. FIGURA 2 Vectores con flechas. 


La visualización geométrica de un vector como 


I se facilita al incluir una flecha 


(un segmento de recta dirigido) desde el origen (0, 0) al punto (3, — 1), como en la figura 2. 
En este caso, los puntos individuales a lo largo de la flecha carecen de significado especial. 2 

La suma de dos vectores tiene una útil representación geométrica. La siguiente regla 
puede verificarse mediante geometría analítica. 


2 En física, las flechas representan fuerzas y. por lo general, son libres para moverse en el espacio. En la sección 4.1 
se analizará esta interpretación de vectores. 
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Regla del paralelogramo para la adición 

Si u y v en R 2 se representan como puntos en el plano, entonces u + v corresponde 
a un cuarto vértice del paralelogramo cuyos otros vértices son u, 0 y v. Véase la fi¬ 
gura 3. 



FIGURA 3 Regla del paralelogramo. 


EJEMPLO 2 Los vectores u = 
figura 4. 



y 


U + V = 



se muestran en la 



El siguiente ejemplo ilustra el hecho de que el conjunto de todos los múltiplos escalares 
de un vector diferente de cero (también llamado no nulo), fijo, es una recta que pasa por el 
origen, (0, 0). 


EJEMPLO 3 Sea u = 


. En una gráfica muestre los vectores u, 2u y — fu. 


SOLUCIÓN Observe la figura 5, donde se indican u, 2u = 


r 6i 

2 

' -2" 

i— 

1 

N> 

i_ 

y- f u = 

2/3 


La fle¬ 


cha para 2u es el doble de largo que la flecha para u, y las flechas apuntan en el mismo 
sentido. La flecha para — |u es dos tercios de la longitud de la flecha para u, y las flechas 
apuntan en sentidos opuestos. En general, la longitud de la flecha para cu es |c| veces la 


§“ 

0u 



*1 



U 

u 


2u 



Múltiplos típicos de u 


FIGURA 5 


Conjunto de todos los múltiplos de u 
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FIGURA 6 

Múltiplos escalares. 


longitud de la flecha para u. [Recuerde que la longitud del segmento de línea de (0, 0) a (a, b) 
es Va 2 + b 2 . Esto se analizará en el capítulo 6]. ■ 


Vectores en [R 3 


Los vectores en R 3 son matrices columna de 3 x 1 con tres entradas. Se representan geo¬ 
métricamente mediante puntos en un espacio coordenado tridimensional; algunas veces se 


incluyen flechas desde el origen para dar una mayor claridad visual. Los vectores a = 


2 

3 

4 


y 2a se muestran en la figura 6. 


Vectores en IR" 


Si n es un entero positivo, R" (léase “erre ene”) denota la colección de todas las listas (o n-adas 
ordenadas) de n números reales, generalmente escritas como matrices columna de n x 1 del 
tipo 


Mi 

U 2 

Un 


El vector cuyas entradas son todas cero se llama vector cero y se denota con 0. (El nú¬ 
mero de entradas en 0 será evidente a partir del contexto). 

La igualdad de vectores en R” y las operaciones de multiplicación escalar y suma vecto¬ 
rial en R" se definen entrada por entrada como en R 2 . Esas operaciones sobre vectores tienen 
las siguientes propiedades, las cuales pueden verificarse directamente a partir de las propieda¬ 
des correspondientes de los números reales. Véase el problema de práctica 1 y los ejercicios 
33 y 34 al final de esta sección. 



FIGURA 7 

Resta vectorial. 


Propiedades algebraicas de R" 

Para todo u, v, w en R" y para todos los escalares c y d: 

i. u + v = v + u 

v. c(u + v) = cu + ex 

ii. (u + v) + w = u + (v + w) 

vi. (c + <i)u = cu + du 

iii. u + 0 = 0 + u = u 

vii. c(d u) = (cd)(u ) 

iv. u + (—u) = —u + u = 0, 

viii. lu = u 

donde — u denota ( — l)u 



Para simplificar la notación, un vector del tipo u + (— l)v con frecuencia se escribe como 
u — v. La figura 7 muestra a u — v como la suma de u y — v. 

Combinaciones lineales 


Dados los vectores vi, V2,..., x p en R" y dados los escalares c i, C2,..., c p , el vector y definido 
por 

y = civi -I-b c p x p 


se llama combinación lineal de vi,..., x p con pesos c p . La propiedad ii anterior nos 
permite omitir los paréntesis al formar la combinación lineal. Los pesos en una combinación 
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lineal pueden ser cualesquiera números reales, incluyendo el cero. Por ejemplo, algunas com¬ 
binaciones lineales de los vectores vi y V 2 son 

V3vi+v 2 , ¿V! (= i Vi + 0v 2 ) y 0 (= Ovi + 0v 2 ) 


EJEMPLO 4 La figura 8 identifica combinaciones lineales seleccionadas de Vi 


y v 2 


. (Observe que los conjuntos de líneas paralelas de la rejilla están trazados me¬ 


diante múltiplos enteros de vi y v 2 ). Estime las combinaciones lineales de vi y v 2 que generan 
los vectores uyw. 


3v, 


2v 


^i\2 v r^r 

1 

1 1 

I 


3v, 


2v 0 


0 


- V j/'—V 

z\ V 1 


- 2v i + V 


-2v 0 


nL^^ 2v i 


FIGURA 8 Combinaciones lineales de y v 2 . 


3vi 

1 

X 1 

w 

(Ax' 






1 

FIGURA 9 



SOLUCIÓN La regla del paralelogramo indica que u es la suma de 3v 1 y —2v 2 ; es decir, 

u = 3vi — 2v 2 

Esta expresión para u se puede interpretar como las instrucciones para desplazarse desde el 
origen a u por dos trayectorias rectas. Primero, desplácese 3 unidades en la dirección de V| ha¬ 
cia 3vi, y luego avance —2 unidades en la dirección de v 2 (paralela a la recta que pasa por v 2 y 
0). Después, aunque el vector w no está sobre una línea de la rejilla, w parece estar a la mitad 
del camino entre dos pares de rectas de la rejilla, en el vértice de un paralelogramo determi¬ 
nado por (5/2)vi y (— l/2)v 2 . (Véase la figura 9). Así, una estimación razonable de w es 

w = fvi - \y 2 ■ 


El siguiente ejemplo relaciona un problema sobre combinaciones lineales con la pregun¬ 
ta fundamental de existencia que se estudió en las secciones 1.1 y 1.2. 



r 


"2" 


7~ 

EJEMPLO 5 Sean ai = 

-2 

, a 2 = 

5 

y b = 

4 


-5 


6 


-3 


. Determine si b se puede 


generar (o escribir) como una combinación lineal de ai y a 2 . Es decir, determine si existen 
pesos X| y x 2 tales que 


jqai + x 2 a 2 = b 


( 1 ) 


Si la ecuación vectorial (1) tiene solución, encuéntrela. 

SOLUCIÓN Aplique las definiciones de multiplicación escalar y suma vectorial para rescri¬ 
bir la ecuación vectorial 



1 ' 


~2~ 


7" 

Xl 

-2 

+ X 2 

5 

= 

4 


-5 


6 


-3 

1 

t 

t 

ai 

a 2 

b 
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que es lo mismo que 


*1 


2 x 2 


7“ 

— 2 xi 

+ 

5x 2 

= 

4 

—5xi 


_ 6x2 _ 


-3 


XI + 2X2 


7" 

—2xi + 5 x'2 

= 

4 

—5 x'i + 6x2 


-3 


Los vectores en los miembros izquierdo y derecho de (2) son iguales si y solo si sus entradas 
correspondientes son iguales. Es decir, x\ y X 2 hacen válida la ecuación vectorial (1) si y solo 
si x\ y X 2 satisfacen el sistema 

X\ + 2x2 = 7 

—2xi + 5x 2 = 4 (3) 

—5.x i + 6 x 2 = —3 

Para resolver este sistema, se reduce por filas la matriz aumentada del sistema como 
sigue : 3 


1 

2 

7" 


” 1 

2 

7 


” 1 

2 

7 


_ 1 

0 

3~ 

-2 

5 

4 

~ 

0 

9 

18 

~ 

0 

1 

2 

~ 

0 

1 

2 

-5 

6 

-3 


0 

16 

32 


0 

16 

32 


0 

0 

0 


La solución de (3) es x\ = 3 y X 2 = 2. Así que b es una combinación lineal de a¡ y a 2 , con 
pesos xi = 3 y X 2 = 2. Es decir, 


r 


~2~ 


7" 

-2 

+ 2 

5 

= 

4 

-5 


6 


-3 


Observe en el ejemplo 5 que los vectores originales ai, a 2 y b son las columnas de la 
matriz aumentada reducida por filas: 


1 

2 

7 

-2 

5 

4 

-5 

6 

-3 

t 

i 

t 

ai 

a 2 

b 


Por brevedad, se escribe esta matriz en una forma que identifique sus columnas, a saber, 

[a, a 2 b] (4) 


De la ecuación vectorial (1) es claro cómo escribir esta matriz aumentada, sin realizar los 
pasos intermedios del ejemplo 5. Tome los vectores en el orden en que aparecen en (1) y 
colóquelos en las columnas de una matriz como en (4). 

El análisis anterior puede modificarse fácilmente para establecer el siguiente hecho fun¬ 
damental. 


Una ecuación vectorial 

xiUi + X 2&2 + ••• + x n a„ = b 

tiene el mismo conjunto solución que el sistema lineal cuya matriz aumentada es 

[ai a 2 ••• a„ b] (5) 

En particular, b se puede generar por una combinación lineal de ai,..., a„ si y solo 
si existe una solución al sistema lineal correspondiente a la matriz (5). 


3 El símbolo ~ entre matrices denota equivalencia de filas (sección 1.2). 
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CAPÍTULO 1 Ecuaciones lineales en álgebra lineal 


Una de las ideas fundamentales en álgebra lineal es el estudio del conjunto de todos los 
vectores que se pueden generar o escribir como una combinación lineal de un conjunto fijo 
{vi,..., v p } de vectores. 


DEFINICION Si Vi,..., \ p están en R", entonces el conjunto de todas las combinaciones lineales de 
vi,..., x p se denota como Gen {vi,..., x p ¡ y se llama el subconjunto de R" extendido 

o generado por vi,..., x p . Es decir, Gen {Vi,_ , x p ) es el conjunto de todos los vectores 

que se pueden escribir en la forma 

C1V1 + C2V2 + ••• + CpXp 

con escalares ci,..., c p . 


Preguntar si un vector b está en Gen {vi,..., v ;; ¡ equivale a preguntar si la ecuación 
vectorial 


X 1 V 1 + x 2 x 2 + ••• + XpXp = b 

tiene una solución o, de manera equivalente, si el sistema lineal con la matriz aumentada 
[vi ••• x p b] tiene una solución. 

Observe que Gen {vi,..., x p ] contiene a cada múltiplo escalar de Vi (por ejemplo), 
ya que cv¡ = cvi + OV2 + ••• + 0v ;) . En particular, el vector cero debe estar en Gen 
{vi,..., x p }. 

Descripción geométrica de Gen {v} y de Gen {u, v} 

Sea v un vector diferente de cero en R 3 . Entonces Gen {v} es el conjunto de todos los múl¬ 
tiplos escalares de v, que es el conjunto de puntos sobre la recta en R 3 que pasa por v y 0. 
Véase la figura 10. 

Si u y v son vectores diferentes de cero en R 3 , y v no es un múltiplo de u, entonces 
Gen {u, v¡ es el plano en R 3 que contiene a u, v y 0. En particular, Gen {u, v} contiene la 
recta en R 3 que pasa por u y 0, y la recta que pasa por v y 0. Véase la figura 11. 




FIGURA 10 Gen {v} como una recta FIGURA 11 Gen ¡u, v} como 

que pasa por el origen. un plano que pasa por el origen. 


EJEMPLO 6 Sean aj = 

1 ' 
-2 

, a 2 = 

5 

-13 

y b = 

~-3~ 

8 


3 


-3 


1 


. Entonces Gen {ai, 82} 


es un plano que pasa por el origen en R 3 . ¿Está b en ese plano? 
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SOLUCIÓN ¿Tiene solución la ecuación x\&i + x 2 a 2 = b? Para responder a esto, reduzca 
por fdas la matriz aumentada [ai ai b]: 


1 5-3 


"1 5-3 


"1 5-3" 

-2 -13 8 

~ 

0-3 2 

~ 

0-3 2 

3 -3 1 


0 -18 10 


0 0-2 


La tercera ecuación es 0 = —2,1a cual muestra que el sistema no tiene solución. La ecuación 
vectorial X i a i + x 2 a 2 = b no tiene solución, de manera que b no está en Gen [ a i, ai}. ■ 


Combinaciones lineales en aplicaciones 

El ejemplo final muestra cómo surgen múltiplos escalares y combinaciones lineales cuando 
una cantidad, como el “costo”, se descompone en varias categorías. El principio básico en 
este ejemplo concierne al costo de fabricar varias unidades de un producto cuando se conoce 
el costo por unidad: 

número 1 ] costo 1 _ ícostol 

1 de unidades] [por unidad] ] total ] 


EJEMPLO 7 Una empresa fabrica dos productos. Para obtener $1.00 del producto B, la 
empresa gasta $0.45 en materiales, $0.25 en mano de obra y $0.15 por concepto de costos 
indirectos. Para obtener $1.00 del producto C, la empresa gasta $0.40 en materiales, $0.30 
en mano de obra y $0.15 en costos indirectos. Sean 


b = 

".45 

.25 

y c = 

".40" 

.30 


.15 


.15 


Entonces b y c representan los “costos por dólar de ingreso” para los dos productos. 
d) ¿Qué interpretación económica puede darse al vector 100b? 

b ) Suponga que la empresa desea fabricar x¡ dólares del producto B y x 2 dólares del produc¬ 
to C. Dé un vector que describa los diversos costos que tendrá que enfrentar la empresa 
(por materiales, mano de obra y gastos indirectos). 

SOLUCIÓN 

a ) Calcule 



".45 


"45" 

100b = 100 

.25 

= 

25 


.15 


15 


El vector 100b lista los diversos costos para producir $100 del producto B, a saber, $45 
por materiales, $25 por mano de obra y $15 por gastos indirectos. 
b ) Los costos de fabricación de X\ dólares del producto B están dados por el vector X|b, y los 
costos para manufacturar x 2 dólares del producto C están dados por x 2 c. Así que los cos¬ 
tos totales para ambos productos están dados por el vector xqb + x 2 c. ■ 


PROBLEMAS DE PRÁCTICA 

1. Demuestre que u + v = v + u para cualesquiera u y v en IR". 

2 . Obtenga el valor o los valores de h para que y esté en Gen { Vi, v 2 , V3} si 


1" 


r 5i 


m 

1 


1 

-1 

-2 

, v 2 = 

1 

1 1 

-p- 

1_ 

, v 3 = 

1 

0 

II 

3 

h 


vi = 
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1.3 EJERCICIOS 

En los ejercicios 1 y 2, calcule u + v y u — 2v. 


1 . u = 


-1 

2 


-3 

-1 


2 . u = 


, V : 


En los ejercicios 3 y 4, muestre los siguientes vectores utilizando 
flechas en una gráfica xy: u, v, —v, — 2 v, u + v, u — vyu — 2 v. 
Observe que u — v es el vértice de un paralelogramo cuyos otros 
vértices son u, 0 y — v. 

3. u y v como en el ejercicio 1 4. u y v como en el ejercicio 2 

En los ejercicios 5 y 6 , escriba un sistema de ecuaciones que sea 
equivalente a la ecuación vectorial dada. 



3" 


5" 


" 2 ~ 

5. Xi 

-2 

+ %2 

0 

= 

-3 


8 


-9 


8 


6. x¡ 


3' 


'7' 


'- 2 ' 


" 0 " 

-2 

+ 

_ 3 _ 

+ X 3 

1 

— 

0 


Utilice la figura adjunta para escribir cada vector listado en los 
ejercicios 7 y 8 como una combinación lineal de u y v. ¿Cada vec¬ 
tor en IR 2 es una combinación lineal de u y v? 


- 2 v 


2 v 


7. Vectores a, b, c y d 

8. Vectores w, x, y y z 

En los ejercicios 9 y 10, escriba una ecuación vectorial que sea equi¬ 
valente al sistema de ecuaciones dado. 

9. x 2 + 5x 3 = 0 10. 3xi — 2x 2 + 4x 3 = 3 

4xi + 6 x 2 — x 3 = 0 — 2xi — 7 x 2 + 5x 3 = 1 

—Xi + 3 x 2 — 8 x 3 = 0 5xi + 4 x 2 — 3x 3 = 2 

En los ejercicios 11 y 12, determine si b es una combinación lineal 
de ai, a 2 y a 3 . 


En los ejercicios 13 y 14, determine si b es una combinación lineal de 
los vectores formados a partir de las columnas de la matriz A. 


13. A = 


14. A = 


1 —4 2 


3 

0 3 5 

, b = 

-7 

1 

K> 

OO 

1 

4^ 


_ —3 _ 

'10 5 


2' 

-2 1 -6 

, b = 

-1 

O 

K> 

OO 


6 



1 ' 


"-5~ 


3 

15. Sean a[ = 

3 

-1 

. a 2 = 

-8 

2 

y b = 

-5 

h 


¿Con qué 


valor (o valores) de h se encuentra b en el plano generado por ai 
y a 2 ? 


16. Sean Vi = 


valor (o valores) de h se encuentra y en el plano generado por 
vi y v 2 ? 

En los ejercicios 17 y 18, liste cinco vectores en Gen {vi, v 2 J. Para 
cada vector, muestre los pesos sobre y v 2 empleados para generar 
el vector e indique las tres entradas de este. No realice bosquejos. 


1 ' 
0 

. v 2 = 

"-2" 

1 

y y = 

h~ 

-3 

. ¿Para qué 

-2 


7 


-5 



17. Vi 


v 


1 

1 

-2 


, v 2 


18. vi = 

19. Dé una descripción geométrica de Gen (vi, v 2 } para los vec- 


z 

8" 


r 121 

tores Vi = 

2 

-6 

y y 2 = 

- 1 

m os 

1 

_l 


20. Realice una descripción geométrica de Gen {vi, v 2 } para los 
vectores del ejercicio 18. 


21. Sean u = 


y v = 


. Demuestre que 


esta en 


Gen {u, v) para todas las h y k. 


22. Construya una matriz A de 3 x 3, con entradas diferentes de 
cero, y un vector b en IR 3 tal que b no esté en el conjunto gene¬ 
rado por las columnas de A. 

En los ejercicios 23 y 24, marque cada enunciado como falso o ver¬ 
dadero. Justifique sus respuestas. 

23. a) Otra notación para el vector I" ^les[—4 3]. 



r n 


"0~ 


5" 


2" 

L J 


11 . ai = 

1 

CM O 

1 

_1 

, a 2 = 

1 

2 

, a 3 = 

-6 

8 

, b = 

-1 

6 

b) Los puntos en el plano que corresponden a 

r _ i 

"- 2 " 

5 _ 


12. ai = 


a 2 


—2 

3 

-2 


a 3 


b = 


11 

-5 

9 


-5 

2 


están sobre una recta que pasa por el origen. 


c) Un ejemplo de combinación lineal de los vectores vi y v 2 
es el vector |v 3 . 
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d) El conjunto solución del sistema lineal cuya matriz aumen¬ 
tada es [ai a2 83 b] coincide con el conjunto solución de la 
ecuación jqai + *282 + *383 = b. 

e) El conjunto Gen ¡u, v} siempre se visualiza como un plano 
que pasa por el origen. 


24. a) Cuando u y v son vectores diferentes de cero. Gen {u, v¡ 
solo contiene la recta que pasa por u y por el origen, y la 
recta que pasa por v y el origen. 

b) Cualquier lista de cinco números reales es un vector en IR 5 . 

c) Preguntar si el sistema lineal correspondiente a la matriz 
aumentada [ai a2 a3 b] tiene solución equivale a preguntar 
si el vector b está en Gen {ai, a2, a3¡. 

d) El vector v resulta cuando un vector u — v se suma al vec¬ 
tor v. 

e) No todos los pesos c p en una combinación lineal 

C1V1 + ••• + CpXp pueden ser cero. 



1 

0 -4" 


4 “ 


25. Sean A = 

0 

-2 

3 —2 

6 3 

y b = 

1 

-4 

. Denote las co- 


lumnas de A por ai, a^, 83, y sea W = Gen [ai, a2, 83). 

a) ¿Está b en [ai, a2, 83}? ¿Cuántos vectores hay en [ai, a 2 , 

a 3 }? 

b) ¿Está b en W1 ¿Cuántos vectores hay en W7 

c) Demuestre que ai está en W. [Sugerencia: Las operaciones 
de fila son innecesarias]. 


26. 


Sean A = 


2 

0 

6" 


' 10" 

-1 

8 

5 

, b = 

3 

1 

-2 

1 


7 


y sea W el conjunto 


de todas las combinaciones lineales de las columnas de A. 


a ) ¿Está b en W7 

b) Demuestre que la segunda columna de A está en W. 


27. Una compañía minera posee dos minas. En un día, la mina #1 
produce mineral que contiene 30 toneladas métricas de cobre 
y 600 kilogramos de plata, mientras que, también en un día, 
la mina #2 produce mineral que contiene 40 toneladas métri¬ 
cas de cobre y 380 kilogramos de plata. Sean = 

. Así, vi y V2 representan la “producción diaria” 
de la mina #1 y la mina #2, respectivamente. 

a) ¿Qué interpretación física puede darse al vector 5vi? 

b ) Suponga que la compañía opera la mina #1 durante xi días y 
la mina #2 por *2 días. Escriba una ecuación vectorial cuya 
solución dé el número de días que cada mina debería operar 
para producir 240 toneladas de cobre y 2824 kilogramos de 
plata. No resuelva la ecuación. 

c) [M] Resuelva la ecuación en b). 




28. Una planta eléctrica de vapor quema dos tipos de carbón: an¬ 
tracita (A) y bituminoso (B). Por cada tonelada de A que se 
quema, la planta produce 27.6 millones de Btu de calor, 3100 
gramos (g) de dióxido de sulfuro, y 250 g de contaminantes 
sólidos (partículas). Por cada tonelada de B que se quema, la 


planta produce 30.2 millones de Btu, 6400 g de dióxido de sul¬ 
furo, y 360 g de contaminantes sólidos (partículas). 

a) ¿Cuánto calor produce la planta cuando quema toneladas 
de A y v 2 toneladas de B? 

b) Suponga que la producción de la planta de vapor está des¬ 
crita por un vector que lista las cantidades de calor, dióxido 
de sulfuro y contaminantes sólidos. Exprese esta produc¬ 
ción como una combinación lineal de dos vectores, supo¬ 
niendo que la planta quema x\ toneladas de A y jc 2 tonela¬ 
das de B. 

c ) [M] Durante cierto tiempo, la planta de vapor produjo 162 
millones de Btu de calor, 23,610 g de dióxido de sulfuro y 
1623 g de contaminantes sólidos. Determine cuántas tonela¬ 
das de cada tipo debe haber quemado la planta. Como parte 
de la solución, incluya una ecuación vectorial. 

29. Sean Vi,..., Xk puntos en R 3 y suponga que para j = 1,..., k un 
objeto con masa m¡ está localizado en el punto x¡. Los físicos 
llaman masas puntuales a esos objetos. La masa total del sis¬ 
tema de masas puntuales es 

m = nii + ■■■ + nik 

El centro de gravedad (o centro de masa) del sistema es 

v = —[mix 1 H-1- m k x k \ 

m 

Calcule el centro de gravedad del sistema que consiste en las 
siguientes masas puntuales (véase la figura): 


Punto 

Masa 

V! = (2, -2, 4) 

4g 

v 2 = (-4, 2, 3) 

2g 

v 3 = (4, 0, -2) 

3g 

v 4 = (1, -6, 0) 

5g 


*3 



30. Sea v el centro de masa de un sistema de masas puntuales 
localizadas en vi,..., v* como en el ejercicio 29. ¿Está v en 
Gen [vi,..., v*}? Explique su respuesta. 
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31. Una delgada placa triangular de densidad y grosor uniformes 
tiene vértices en vi = (0. 1), v 2 = ( 8 , 1) y V 3 = (2, 4), como 
en la figura que aparece a continuación; la masa de la placa es 
de 3 g. 


Placa metálica 


H—1—1—1—1—1—1—1—1— x l 
1 8 

a) Encuentre las coordenadas (x, y) del centro de masa de la 
placa. Este “punto de equilibrio” de la placa coincide con 
el centro de masa de un sistema que consta de tres masas 
puntuales de 1 g colocadas en los vértices de la placa. 

b) Determine cómo distribuir una masa adicional de 6 g en los 
tres vértices de la placa para así mover su punto de equilibrio 
a (2, 2). [Sugerencia: Sean wq, w 2 y W 3 las masas agregadas a 
los tres vértices, de manera que w\ + W 2 + W 3 = 6]. 

32 . Considere los vectores vi, V2, V3 y b en IR 2 , que se muestran en 
la figura. ¿Tiene solución la ecuación .viví + % 2\2 + JC3V3 = b? 


“2 

A 


¿Es única la solución? Utilice la figura para explicar sus 
respuestas. 



33. Con los vectores u = ( u \,..., u„), v = (vi,..., v„) y w = (wi,. . ., w„), 
verifique las siguientes propiedades algebraicas de IR". 

a) (u + v) + w = u + (v + w) 

b) c(u + v) = cu + cv para cada escalar c 

34. Utilice el vector u = (uu„) para verificar las siguientes 
propiedades algebraicas de IR”. 

¡ 7 ) u + (—u) = (—u) + u = 0 

b) c(r/u) = (cd) u para todos los escalares c y d 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Tome los vectores arbitrarios u = («i,..., u „) y v = (i»i,..., v„) en R”, y calcule 


u + v = (u 1 + ui. u„ + v n ) 

= (vi + ui . v„ + u n ) 


Definición de suma vectorial 
Conmutatividad de la adición en IR 


= V + u 


Definición de suma vectorial 


h=9 


Gen ¡Vi, v 2 , v 3 ) 


h=l 


2. El vector y pertenece a Gen {Vi, V 2 , V 3 ¡ si y solo si existen escalares x\, xo, xj tales que 


v 2 

h = 5 , 

x¡ 

r 

-1 

+ X 2 

5 

-4 

+ X 3 

~-3" 

1 

— 

~-4~ 

3 

v 3 


-2 


-7 


0 


h 


Esta ecuación vectorial es equivalente a un sistema de tres ecuaciones lineales con tres 
incógnitas. Si la matriz aumentada de este sistema se reduce por filas, se encuentra que 



'-4" 


1 5-3-4 


"1 5-3 -4 


"1 5-3 -4 

Los puntos 

3 

h 

están sobre 

-1-4 1 3 

-2 -7 0 h 


0 1-2 -1 

0 3-6 h- 8 


0 1-2 -1 

0 0 0 h - 5 


la recta que se interseca con 
el plano cuando h = 5. 


Este sistema es consistente si y solo si no existe pivote en la cuarta columna. Es decir, 
h — 5 debe ser 0. Así, y está en Gen { vi, V2, V3} si y solo si h = 5. 


Recuerde: La presencia de una variable libre en un sistema no garantiza que este sea 
consistente. 


1.41 ECUACIÓN MATRICIAL Ax = b 


Una idea fundamental en álgebra lineal consiste en ver una combinación lineal de vectores 
como el producto de una matriz y un vector. La siguiente definición permite reformular algu¬ 
nos de los conceptos de la sección 1.3 desde nuevos puntos de vista. 
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DEFINICIÓN 


Si A es una matriz de m x n, con columnas ai,..., a,„ y si x está en IR", entonces el 

producto de A y x, denotado como Ax, es la combinación lineal de las columnas de 
A utilizando como pesos las entradas correspondientes en x; es decir, 


Ax = [a, 



= Xi&i + x 2 a 2 + ••• + x„a„ 


Observe que Ax está definido solamente si el número de columnas de A es igual al número 
de entradas en x. 


EJEMPLO 1 


a) 


1 

0 




+ 7 


-1 

3 


4 


6 


-7 

O 

+ 

-15 

+ 

<N 


3 

6 


en 

1 

<N 

r ^ 1 

1 

r 21 


r-3i 


OO 


"-21" 


— 13 " 

8 0 

-5 2 

i 

4 

1 _ 

'ñJ- 

11 

1 

1 

Lh 00 

1_ 

+ 7 

1 

K> O 

1_ 

— 

32 

-20 

+ 

0 

14 

— 

32 

-6 


EJEMPLO 2 Para vi, x 2 , V 3 en R m , escriba la combinación lineal 3v¡ — 5 v 2 + 7 v 3 como 
una matriz por un vector. 


SOLUCIÓN Coloque vi, V 2 , V 3 en las columnas de una matriz A y coloque los pesos 3, —5 
y 7 en un vector x. Es decir, 


3vi — 5 v2 + 7v 3 


[vi V2 V 3 ] 



Ax 


La sección 1.3 mostró cómo escribir un sistema de ecuaciones lineales como una ecua¬ 
ción vectorial que implica una combinación lineal de vectores. Por ejemplo, el sistema 


Xi + 2 .T 2 — X 3 = 4 
— 5X2 + 3X3 = 1 


( 1 ) 


es equivalente a 



' 1 " 


2 " 


’-l" 


"4" 

Xl 

0 

+ X 2 

-5 

+ X 3 

3 

— 

1 


( 2 ) 


Como en el ejemplo 2, la combinación lineal en el lado izquierdo es una matriz por un vector, 
de manera que ( 2 ) se convierte en 


1 

2 

- 1 " 

Xi 


'4' 

0 

-5 

3 

•V2 

x 3 


1 


La ecuación (3) tiene la forma Ax = b. Tal ecuación se llama ecuación matricial, para 
distinguirla de una ecuación vectorial como la que se muestra en ( 2 ). 

Observe cómo la matriz en (3) es justamente la matriz de coeficientes del sistema (1). 
Cálculos similares indican que cualquier sistema de ecuaciones lineales, o cualquier ecua¬ 
ción vectorial como ( 2 ), se puede escribir como una ecuación matricial equivalente en la for¬ 
ma Ax = b. Esta sencilla observación se utilizará de manera recurrente a lo largo del texto. 

A continuación se presenta el resultado formal. 
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TEOREMA 3 


Si A es una matriz de m x n, con columnas ai,..., a,„ y si b está en IR" 1 , 
matricial 

la ecuación 

¿2 

II 

¡* 

(4) 

tiene el mismo conjunto solución que la ecuación vectorial 


xiai + x 2 a 2 + ••• + x„a„ = b 

(5) 

la cual, a la vez, tiene el mismo conjunto solución que el sistema de ecuaciones lineales 
cuya matriz aumentada es 

[ai a 2 ••• a„ b] 

( 6 ) 


El teorema 3 constituye una poderosa herramienta para comprender problemas de ál¬ 
gebra lineal, porque ahora un sistema de ecuaciones lineales puede verse en tres formas dife¬ 
rentes, pero equivalentes: como una ecuación matricial, como una ecuación vectorial o como 
un sistema de ecuaciones lineales. Siempre que usted construya un modelo matemático 
de un problema de la vida real, tendrá libertad para elegir qué punto de vista es más natural. 
Además, será posible pasar de una formulación del problema a otra, según sea convenien¬ 
te. En cualquier caso, la ecuación matricial (4), la ecuación vectorial (5) y el sistema de 
ecuaciones se resuelven de la misma manera: por reducción de filas de la matriz aumen¬ 
tada ( 6 ). Más adelante se analizarán otros métodos de solución. 


Existencia de soluciones 

La definición de Ax conduce directamente al siguiente hecho que resulta útil. 


La ecuación Ax = b tiene una solución si y solo si b es una combinación lineal de las 
columnas de A. 


En la sección 1.3 se consideró la pregunta de existencia: “¿Está b en Gen {ai,..., a,,}?”. 
De manera equivalente: “¿Es consistente Ax = b?”. Un problema de existencia más difícil 
consiste en determinar si la ecuación Ax = b es consistente para toda b posible. 



1 

3 

4" 


b\ 

EJEMPLO 3 Sean A = 

-4 

2 

-6 

y b = 

b 2 


-3 

-2 

-7 


¿3 


. ¿La ecuación Ax = b es con¬ 


sistente para todas las posibles b\, ¿> 2 , b 3 ? 


SOLUCIÓN Se reduce por filas la matriz aumentada para Ax = b: 


1 

3 

4 

b\ 


" 1 

3 

4 

b\ 


-4 

2 

-6 

b 2 

~ 

0 

14 

10 

b 2 + 4¿q 


-3 

-2 

-7 

63 _ 


0 

7 

5 

¿3 + 3¿i _ 






" 1 

3 

4 


b\ 




~ 

0 

14 

10 

b 2 ■ 

+ 4 b\ 





0 

0 

0 

¿3 + 3¿>i - 

- 5(62 + 4 /;,) 


La tercera entrada en la columna 4 es igual a b\ — (íh + 6 3 . La ecuación Ax = b no es 
consistente para toda b porque algunas asignaciones de b pueden hacer que b\ — 5 A + ¿> 3 
sea diferente de cero. ■ 
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FIGURA 1 Las columnas de 
A = {ai, ai, 83} generan un 
plano a través de 0. 


La matriz reducida del ejemplo 3 da una descripción de todas las b para las cuales la 
ecuación Ax = b es consistente: las entradas en b deben satisfacer 


b\ - \b 2 + ¿>3 = 0 


Esta es la ecuación de un plano que pasa por el origen en IR 3 . El plano es el conjunto de todas 
las combinaciones lineales de las tres columnas de A. Véase la figura 1. 

La ecuación Ax = b del ejemplo 3 no es consistente para todas las b porque la for¬ 
ma escalonada de A tiene una fila de ceros. Si A tuviera un pivote en las tres filas, no habría 
que preocuparse por los cálculos en la columna aumentada, ya que, en este caso, una forma 
escalonada de la matriz aumentada no tendría una fila como [0 0 0 1|. 

En el siguiente teorema, la frase “las columnas de A generan a R"'” significa que cada 
b en R”' es una combinación lineal de las columnas de A. En general, un conjunto de vecto¬ 
res {vi,..v p } en R"' genera a R"' si cada vector en R”' es una combinación lineal de Vi,..., \ p ; 
es decir, si Gen {vi,..., v /; ¡ = R m . 


TEOREMA 4 Sea A una matriz de m x n. Entonces, los siguientes enunciados son lógicamente equi¬ 
valentes. Es decir, para una A particular, todos los enunciados son verdaderos o todos 
son falsos. 

a) Para cada b en R" ! , la ecuación Ax = b tiene una solución. 

b ) Cada b en R m es una combinación lineal de las columnas de A. 

c) Las columnas de A generan R"'. 

d) A tiene una posición pivote en cada fila. 


El teorema 4 es uno de los teoremas más útiles en este capítulo. Los enunciados a), 
b ) y c) son equivalentes a causa de la definición de Ax y lo que significa para un conjunto 
de vectores generar R m . El análisis posterior al ejemplo 3 revela por qué a) y d) son equi¬ 
valentes; al final de la sección se presenta una prueba de ello. Los ejercicios aportan ejemplos 
de cómo emplear el teorema 4. 

Advertencia: El teorema 4 se refiere a una matriz de coeficientes, no a una matriz aumentada. 
Si una matriz aumentada [ A b] tiene una posición pivote en cada fila, entonces la ecuación 
Ax = b puede o no ser consistente. 


Cálculo de Ax 

Los cálculos en el ejemplo 1 se apoyaron en la definición del producto de una matriz A y 
un vector x. El siguiente ejemplo sencillo conducirá a un método más eficiente para calcular 
las entradas en Ax cuando los problemas se resuelvan a mano. 


2 

3 

4“ 


x¡ 

-1 

5 

-3 

y x = 

*2 

6 

-2 

8 


_*3 _ 


EJEMPLO 4 CalculeAx, donde A = 




38 


CAPITULO 1 


Ecuaciones lineales en álgebra lineal 


SOLUCIÓN A partir déla definición, 


" 2 3 4" 

Xl 


2" 


3" 


4" 

-1 5 -3 

6-2 8 

*2 

_* 3 _ 

= *1 

-1 

6 

+ .*2 

5 

-2 

+ *3 

-3 

8 


2xi 


3x 2 


4X3 

-*i 

+ 

5x 2 

+ 

— 3X3 

6xi 


_ -2x 2 _ 


8x3 


2x\ + 3x 2 + 4x3 

—X\ + 5X2 — 3X3 
6xi — 2x2 + 8*3 


( 7 ) 


La primera entrada en el producto Ax es una suma de productos (algunas veces se llama pro¬ 
ducto punto), empleando la primera fila de A y las entradas en x. Es decir, 


2 3 4 

Xl 


2xi + 3x2 + 4x3 


*2 

= 



_* 3 _ 




Esta matriz muestra cómo calcular de forma directa la primera entrada en Ax, sin escribir 
todos los cálculos indicados en (7). De manera similar, la segunda entrada en Ax puede calcu¬ 
larse multiplicando las entradas en la segunda fila de A por las entradas correspondientes en 
x, y después sumando los productos resultantes: 


-1 

5 -3 

Xl 

*2 

— 

—Xl + 5 .X 2 — 3 . X3 



_*3 _ 




De manera semejante, la tercera entrada en Ax puede determinarse con la tercera fila de A y 
las entradas en x. ■ 


Regla fila-vector para calcular Ax 

Si el producto Ax está definido, entonces la i-ésima entrada en Ax es la suma de los 
productos de las entradas correspondientes de la fila i de A y del vector x. 


EJEMPLO 5 


' 1 2-1" 

4" 

72 


’ 1 • 4 + 2 • 3 + (—1) • 7" 


"3" 

0-5 3 

J 

7 


0 • 4 + (-5) -3 + 3-7 


6 



2 

-3" 

" A 

-i 

2- 

4 + (—3) • 7 " 



-13 


b ) 

8 

0 

T- 

7 

= 


8-4 + 0-7 

= 


32 



-5 

2 



_(- 

■5)-4 +2-7 


- 

-6 



" 1 

0 

0 " 

r 


1 • r + 0 • s + 0 • 

t " 


r 

c) 

0 

1 

0 

s 

= 

0 • r + l-s + 0- 

t 

= 

s 


0 

0 

1 

t 


0 • r + 0 • s + 1 • 

t 


t 


Por definición, la matriz del ejemplo 5c) con números 1 en la diagonal y ceros en las 
demás posiciones se llama matriz identidad y se denota con I. Los cálculos en el inciso c) 
indican que Ix = x para toda x en IR 3 . Existe una análoga matriz identidad de n x n, algu¬ 
nas veces denotada como Al igual que en c), I n x = x para toda x en R". 
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TEOREMA 5 


Propiedades del producto matriz-vector Ax 

Es importante el contenido del próximo teorema y se utilizará a lo largo del libro. La demos¬ 
tración se apoya en la definición de Ax y en las propiedades algebraicas de IR". 


Si A es una matriz de m x n, u y v son vectores en IR", y c es un escalar, entonces: 

á) A(u + v) = Au + Av; 
b) A(cu) = c(Au). 


DEMOSTRACIÓN En aras de la sencillez, se toma n = 3, A = [ai a 2 a 3 ], y u, v en R 3 . 
(La demostración para el caso general es similar). Para i = 1, 2, 3, sean u¡ y v¡ las z-ésimas 
entradas en u y v, respectivamente. Para probar el enunciado a), calcule A(u + v) como una 
combinación lineal de las columnas de A empleando como pesos las entradas en u + v. 


A(u +v) 


[ ai a 2 a 3 ] 


U i + U] 

u 2 + v 2 

W 3 + U 3 


i" i" i" 

(w i + npai + (u 2 + r>2)a2 + (w 3 + i> 3 )a 3 

t_t_1_ 


Entradas en u + v 


Columnas de A 


(wiai -I- U 2 a 2 + M 3 a 3 ) + (tqai + r>2a 2 + u 3 a 3 ) 
Au + Av 


Para demostrar el enunciado b), calcule A(cu) como una combinación lineal de las columnas 
de A utilizando como pesos las entradas en cu. 


A(cu) = [ai a 2 a 3 


cu i 
cu 2 
cu 2 


= (cu i)ai + (cu 2 ) a 2 + (cn 3 )a 3 


= c(u iaO + c(u 2 a 2 ) + c(n 3 a 3 ) 
= c(u\&\ + u 2 a 2 + z< 3 a 3 ) 

= c(Au) 


- NOTA NUMÉRICA - 

Con la finalidad de optimizar un algoritmo computacional para calcular Ax, la se¬ 
cuencia de operaciones implicaría datos almacenados en ubicaciones adyacentes de 
memoria. Los algoritmos profesionales más ampliamente utilizados para cálculos ma- 
triciales están escritos en Fortran, un lenguaje que almacena una matriz como un con¬ 
junto de columnas. Tales algoritmos calculan Ax como una combinación lineal de las 
columnas de A. En contraste, si un programa está escrito en el conocido lenguaje C, 
el cual almacena matrices por filas, entonces Ax debería calcularse mediante la regla 
alternativa que usa las filas de A. 


DEMOSTRACIÓN DEL TEOREMA 4 Como se indicó después del teorema 4, los enuncia¬ 
dos a), b ) y c) son lógicamente equivalentes. De manera que es suficiente demostrar (para 
una matriz arbitraria A) que a) y el) son ambos verdaderos o ambos falsos. Eso vinculará a los 
cuatro enunciados. 

Sea U una forma escalonada de A. Dada b en R m , la matriz aumentada [A b] se puede 
reducir por filas a una matriz aumentada [U d] para alguna d en R m : 


[A b]- [U d] 
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Si el enunciado d) es verdadero, entonces cada fila de U contiene una posición pivote y tal 
vez no exista un pivote en la columna aumentada. De manera que Ax = b tiene una solución 
para cualquier b, y a) es verdad. Si d) es falso, la última fila de U solo tiene ceros. Sea d 
cualquier vector con un 1 en su última entrada. En tal caso, [U d] representa un sistema 
inconsistente. Como las operaciones de fila son reversibles, [U d] se puede transformar a la 
forma [A b ]. El nuevo sistema Ax = b también es inconsistente, y a) es falso. ■ 


PROBLEMAS DE PRACTICA 


1. Sean A 


15-20 
-3 1 9-5 

4-8-1 7 



3” 



1 

-2 


—7 " 

II 

a. 

0 

y b = 

9 

0 


-4 




. Es posible demostrar 


que p es una solución de Ax = b. Con base en este hecho, presente a b como una com¬ 
binación lineal específica de las columnas de A. 


. Compruebe el teorema 5a) en este 


'2 

5' 

1 ¡ 

r 4i 

i ¡ 

'-3' 

_ 3 

1 

II 

3 

i_ 

II 

5 


2 . Sean A = 

caso mediante el cálculo de A(u + v) y Au + Av. 


1.4 EJERCICIOS 


En los ejercicios 1 a 4 calcule los productos utilizando: a) la defini¬ 
ción, como en el ejemplo 1, y fe) la regla fila-vector para calcular Ax. 
Si un producto está indefinido, explique por qué. 



'-4 

2 ' 

3' 


' 1 - 

C “ 



1 . 

1 

6 

-2 

2 . 

3 

D 

-1 




0 

1 

7 _ 


1 




1 

2 " 






■ i - 



' -2" 


' 1 

3 - 

-4" 

3. 

-3 

1 


4. 


1 

2 


1 

3 


3 

2 

1 


6 







En los ejercicios 5 a 8, aplique la definición de Ax para escribir la 
ecuación matricial como una ecuación vectorial, o viceversa. 



4“ 


~-5~ 


7“ 


6 ' 

-1 

+ X 2 

3 

~h X$ 

-8 


-8 

7 

-5 

0 

— 

0 

-4 


1 


2 


-7 


8. z, 


+ 32 


+ 33 


+ 34 


5 

12 


En los ejercicios 9 y 10, primero escriba el sistema como una ecua¬ 
ción vectorial y después como una ecuación matricial. 


9. 5xi 4- X 2 — 3x3 = 8 10. 4xi — xi = 8 

2x 2 + 4x 3 = 0 5xi + 3 x 2 = 2 

3xi — x 2 = 1 


Considerando A y b en los ejercicios 11 y 12, escriba la matriz au¬ 
mentada para el sistema lineal que corresponde a la ecuación matri¬ 
cial Ax = b. Después, resuelva el sistema y escriba la solución como 
un vector: 


11 . 


12 . 


13. 



■“ 1 

3 

-4" 




-2" 


A = 

1 

5 

2 

, b 

= 


4 



_ —3 

-7 

6 




12 



1 

2 

-1 ~ 



- 

1 " 


A = 

-3 

-4 

2 

, b 

= 


2 



5 

2 

3 _ 




—3 _ 




"0~ 




3 

-5 

1 

Sean 

u = 

4 

y a 

= 


2 

6 



4 




1 

1 


¿Está u en el plano 


en R 3 generado por las columnas de Al (Véase la figura). 
¿Por qué? 



Plano generado por 
las columnas de A 


14. 


Sean u = 


4' 


'2 

5 

-1 ' 

-1 

y A = 

0 

1 

-1 

4 


1 

2 

0 


. ¿Está u en el sub¬ 


conjunto de R 3 generado por las columnas de Al ¿Por qué? 
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15. Sean A = 


b = 


. Demuestre que la ecua¬ 


ción Ax = b no tiene solución para todas las posibles b, y des¬ 
criba el conjunto de todas las b para las cuales Ax = b sí tiene 
solución. 

16. Repita el ejercicio 15 considerando 


A = 


Los ejercicios 17 a 20 se refieren a las matrices Ay B que se presen¬ 
tan a continuación. Realice los cálculos pertinentes para justificar sus 
respuestas y mencione un teorema adecuado. 


1 

—2 

-1~ 

1 

b\ 

-2 

2 

0 

<< 

II 

b 2 

4 

-1 

3 


_ 


A = 


0 3 
-1 1 
2 -8 
3 -1 


B = 


2 

-4 

7 

—1 


17. 


18. 


19. 


20 . 


ción Ax = b tiene solución para cada b en IR 4 ? 

¿Cada vector en IR 4 se puede escribir como una combinación 
lineal de las columnas de la matriz B anterior? ¿Las columnas 
de B generan a IR 3 ? 

¿Todo vector en IR 4 se puede escribir como una combinación 
lineal de las columnas de la matriz A anterior? ¿Las columnas 
de A generan a IR 4 ? 

¿Las columnas de B generan a IR 4 ? ¿La ecuación Bx = y tiene 
solución para cada y en IR 4 ? 


21. Sean Vi = 


genera a IR 4 ? ¿Por qué? 


1 ~ 


0 “ 


1 " 

0 


-i 


0 

-1 

, y i = 

0 

, V 3 = 

0 

0 


1 


-1 


• ¿{vi,v 2 , v 3 } 



0“ 


0“ 


4~ 

22. Sean v 3 = 

0 

-3 

, v 2 = 

-3 

9 

, v 3 = 

-2 

-6 


•¿{Vi, V2, v 3 } 


genera a IR 3 ? ¿Por qué? 


En los ejercicios 23 y 24. marque cada enunciado como verdadero o 
falso. Justifique sus respuestas. 

23. a) La ecuación Ax = b se reconoce como una ecuación vec¬ 
torial. 

b ) Un vector b es una combinación lineal de las columnas 
de una matriz A si y solo si la ecuación Ax = b tiene al me¬ 
nos una solución. 

c) La ecuación Ax = b es consistente si la matriz aumentada 
[A b] tiene una posición pivote en cada fila. 

d) La primera entrada en el producto Ax es una suma de pro¬ 
ductos. 

e) Si las columnas de una matriz A de m x n generan a 
IR'", entonces la ecuación Ax = b es consistente para cada 
b en IR'". 

/) Si A es una matriz de m x n y si la ecuación Ax = b es in¬ 
consistente para alguna b en IR”', entonces A no puede tener 
una posición pivote en cada fila. 


24. a ) Cada ecuación matricial Ax = b corresponde a una ecua¬ 
ción vectorial con el mismo conjunto solución. 

b) Si la ecuación Ax = b es consistente, entonces b está en el 
conjunto generado por las columnas de A. 

c) Cualquier combinación lineal de vectores siempre se pue¬ 
de escribir en la forma Ax para una matriz A y un vector x 
adecuados. 

d) Si la matriz coeficiente A tiene una posición pivote en cada 
fila, entonces la ecuación Ax = b es inconsistente. 

e) El conjunto solución de un sistema lineal cuya matriz au¬ 
mentada es [ai a 2 a 3 b] coincide con el conjunto so¬ 
lución de Ax = b, si A = [ai a 2 a 3 ]. 

f) Si A es una matriz de m x n cuyas columnas no generan 
a IR'", entonces la ecuación Ax = b es consistente para toda 
b en IR'". 


. Con base en 


este hecho (sin realizar operaciones de fila), encuentre escalares 



4 -3 r 

'-3' 


'-7 

J 25. Observe que 

5-2 5 

-1 

= 

-3 

¿La ecua- 

-6 2 -3 

2 


10 


26. 




'-7' 

1 


4' 


'-3“ 


i' 

Ci, c 2 , c 3 tales que 

-3 

= C\\ 

5 

+ c 2 

—2 

+ C3 

5 



10 
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-6 
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-3 
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1 
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Sean u = 

2 

, v = 

1 

y w = 

1 

. Es posible demos 


5 


3 



1 





trar que 2u — 3v — w = 0. Apóyese en este hecho (sin rea¬ 
lizar operaciones de fila) para obtener x\ y X 2 que satisfagan la 


'7 

1- 

m 



1 

_1 

2 

5 

i 

3 _ 

Xl 

_X 2 _ 

= 

1 

_1_ 


27. 


Rescriba la siguiente ecuación matricial (numérica) en forma 
simbólica como una ecuación vectorial, utilizando los símbolos 
vi, V 2 ,. • • para los vectores y ci, c 2 ,.. • para los escalares. Defina 
qué representa cada símbolo, utilizando los datos presentados 
en la ecuación matricial. 

_ -3‘ 

1 
2 

-1 
2 


11 

-11 


28. Considere que qi, q 2 , q 3 y v son vectores en IR 5 , mientras que 
jci, X 2 y x 3 denotan escalares. Escriba la siguiente ecuación vec¬ 
torial como una ecuación matricial. Identifique cualquier sím¬ 
bolo que utilice. 

-uqi + X 2 q 2 + -V 3 q 3 = v 

29. Construya una matriz de 3 x 3, no en forma escalonada, cuyas 
columnas generen a IR 3 . Demuestre que la matriz que construyó 
tiene la propiedad deseada. 

30. Construya una matriz de 3 x 3, no en forma escalonada, cuyas 
columnas no generen a IR 3 . Demuestre que la matriz que cons¬ 
truyó tiene la característica deseada. 

31. Sea A una matriz de 3 x 2. Explique por qué la ecuación Ax = b 
no puede ser consistente para toda b en IR 3 . Generalice su argu¬ 
mento al caso de una A arbitraria con más filas que columnas. 
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32. ¿Un conjunto de tres vectores en IR 4 podría generar a IR 4 ? 
Explique su respuesta. ¿Y qué hay respecto de n vectores 
en IR"' cuando n es menor que m? 

33. Suponga que A es una matriz de 4 x 3, y b es un vector en 
IR 4 con la propiedad de que Ax = b tiene una solución única. 
¿Qué podría decir sobre la forma escalonada reducida de A? 
Justifique su respuesta. 

34. Considere que A es una matriz de 3 x 4, vi y V 2 son vectores en 
IR 3 , y que w = Vi + \ 2 - Suponga que vi = Aui y V 2 = AU 2 para 
algunos vectores ui y 112 en IR 4 . ¿Qué hecho permite concluir 
que el sistema Ax = w es consistente? (Nota: Ui y U 2 denotan 
vectores, y no entradas escalares de vectores). 

35. Sean A una matriz de 5 x 3, y un vector en IR 3 , y z un vector 
en IR 5 . Suponga que Ay = z. ¿Qué hecho permite concluir que 
el sistema Ax = 5z es consistente? 

36. Suponga que A es una matriz de 4 x 4 y b un vector en IR 4 tal 
que Ax = b tiene una solución única. Explique por qué las co¬ 
lumnas de A deben generar a IR 4 . 

[M] En los ejercicios 37 a 40, determine si las columnas de la matriz 

generan a IR 4 . 
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41. [M] Encuentre una columna de la matriz del ejercicio 39 que 
se pueda eliminar y, aun así, las restantes columnas de la ma¬ 
triz sigan generando a IR 4 . 

42. [M] Encuentre una columna de la matriz del ejercicio 40 que 
se pueda eliminar y, aun así, las restantes columnas sigan ge¬ 
nerando a IR 4 . ¿Se puede eliminar más de una columna? 


WEB 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. La ecuación matricial 
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es equivalente a la ecuación vectorial 
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que expresa a b como una combinación lineal de las columnas de A. 


u + v = 

L-i. 

r 

L 5 

A(u + v) = 

'2 

3 

5 ' 

1 
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4 

Au + Ax = 
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1.5 CONJUNTOS SOLUCIÓN DE SISTEMAS LINEALES 


Los conjuntos solución de sistemas lineales son importantes objetos de estudio en álgebra 
lineal. Más adelante, se presentarán en diversos contextos. Esta sección utiliza notación vec¬ 
torial para dar descripciones explícitas y geométricas de tales conjuntos solución. 

Sistemas lineales homogéneos 

Se dice que un sistema de ecuaciones lineales es homogéneo si se puede escribir en la forma 
Ax = 0, donde A es una matriz de m x n, y 0 es el vector cero en R'". Tal sistema Ax = 0 
siempre tiene al menos una solución, a saber, x = 0 (el vector cero en R"). Esta solución cero 
generalmente se conoce como solución trivial. Para una ecuación dada Ax = 0, la pregunta 
importante es si existe una solución no trivial, es decir, un vector x diferente de cero que 
satisfaga Ax = 0. El teorema de existencia y unicidad de la sección 1.2 (teorema 2) conduce 
de inmediato al siguiente resultado. 


La ecuación homogénea Ax = 0 tiene una solución no trivial si y solo si la ecuación 
tiene al menos una variable libre. 


EJEMPLO 1 Determine si el siguiente sistema homogéneo tiene una solución no trivial. 
Luego, describa el conjunto solución. 

3xi + 5x2 ~ 4x3 = 0 
—3xi — 2x2 + 4x3 = 0 
6xi + X2 — 8x3 = 0 

SOLUCION Sea A la matriz de coeficientes del sistema; la matriz aumentada [A 0] se re¬ 
duce por filas a una forma escalonada: 
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Como X 3 es una variable libre, entonces Ax = 0 tiene soluciones no triviales (una para cada 
asignación de X3). Para describir el conjunto solución, continúe la reducción por filas de 
[A 0] hasta su forma escalonada reducida : 


O 

% 

A x. 



"1 0 -f o 

0 10 0 

0 0 0 0 

Al despejar las variables básicas xi y X 2 se obtiene xi = 5 X 3 , X 2 = 0, con X 3 libre. Como un 
vector, la solución general de Ax = 0 tiene la forma 


X = 

XI 

X 2 

= 

5X3 

0 

= *3 

" 4 “ 

3 

0 

= X3V, donde v = 

" 4 “ 

3 

0 


_*3_ 


_ *3 _ 


_ 1 _ 


_ 1 _ 


Aquí se factorizó X 3 de la expresión para la solución general vectorial. Esto muestra que cada 
solución de Ax = 0 es, en este caso, un múltiplo escalar de v. La solución se obtiene al consi¬ 
derar X 3 = 0. Geométricamente, el conjunto solución es una recta que pasa por 0 en R 3 . Véase 
la figura 1 . ■ 


Xi — 5X3 = 0 

x 2 = 0 
0 = 0 


FIGURA 1 
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Ecuaciones lineales en álgebra lineal 


Observe que una solución no trivial x puede tener algunas entradas cero, siempre y cuan¬ 
do no todas ellas sean cero. 

EJEMPLO 2 Una sola ecuación lineal puede tratarse como un sencillo sistema de ecua¬ 
ciones. Describa todas las soluciones del “sistema” homogéneo 

10 xi — 3.%2 ~ 2x3 = 0 (1) 

SOLUCIÓN No hay necesidad de una notación matricial. Despeje la variable básica x\ en 
términos de las variables libres. La solución general es x¡ = . 3 x 2 + - 2 x 3 , con X 2 y X 3 libres. 
Como un vector, la solución general es 




Xi 


,3x 2 + -2x 3 


.3X2 


.2x3 

X = 

*2 

= 

X2 

= 

X2 

+ 

0 


*3 


X3 


0 


X3 



".3" 


~. 2 ~ 


X 2 

1 

+ X 3 

0 

(con X 2 , X 3 libres) 


0 


1 



t t 

u y 


( 2 ) 


Este cálculo indica que cada solución de (1) es una combinación lineal de los vectores u 
y v, que se muestran en (2). Es decir, el conjunto solución es Gen {u, v}. Puesto que u y v 
no son múltiplos entre sí, el conjunto solución es un plano que pasa por el origen. Véase 
la figura 2 . ■ 


Los ejemplos 1 y 2. junto con los ejercicios, ilustran el hecho de que el conjunto so¬ 
lución de una ecuación homogénea Ax = 0 siempre se puede expresar de manera explícita 
como Gen {vi,..., \ p } para vectores adecuados vi,..., \ p . Si la única solución es el vector 
cero, entonces el conjunto solución es Gen {0}. Si la ecuación Ax = 0 solo tiene una variable 
libre, el conjunto solución es una recta que pasa por el origen, como en la figura 1. Un plano 
que pasa por el origen, como en la figura 2 , da una buena imagen mental para el conjunto 
solución de Ax = 0 cuando existen dos o más variables libres. Observe, sin embargo, que 
se puede emplear una figura similar para visualizar Gen {u, v} aun cuando u y v no estén 
relacionados con soluciones de Ax = 0. Véase la figura 11 de la sección 1.3. 


Forma vectorial paramétrica 

La ecuación original (1) para el plano del ejemplo 2 es una descripción implícita del plano. 
Al resolver esta ecuación se obtiene una descripción explícita del plano como el conjunto 
generado por u y v. La ecuación (2) se llama ecuación vectorial paramétrica del plano. 
Algunas veces dicha ecuación se escribe como 

x = íu + t\ ( s , t en IR) 

para poner de relieve que los parámetros varían sobre todos los números reales. En el ejemplo 
1, la ecuación x = X 3 V (con X 3 libre), o x = tv (con t en R), es la ecuación vectorial paramé¬ 
trica de una recta. Siempre que un conjunto solución se describa explícitamente con vectores 
como en los ejemplos 1 y 2 , se dirá que la solución está en forma vectorial paramétrica. 


Soluciones de sistemas no homogéneos 

Cuando un sistema lineal no homogéneo tiene muchas soluciones, la solución general se 
puede escribir en forma vectorial paramétrica como un vector más una combinación lineal 
arbitraria de vectores que satisfagan el sistema homogéneo correspondiente. 
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EJEMPLO 3 Describa todas las soluciones de ,4x = b, donde 


A = 

"3 5-4" 

-3 -2 4 

y b = 

7" 

-1 


6 1 -8 


-4 



• v + p 

/ 

/ 


V 


FIGURA 3 

La suma de p a v traslada 
v a v + p. 


SOLUCIÓN Aquí A es la matriz de coeficientes del ej emplo 1. Al efectuar operaciones de fila 
sobre [A b] se obtiene 


3 

5 

-4 

7 


" 1 

0 

4 

3 

-1 

-3 

-2 

4 

-1 

~ 

0 

1 

0 

2 

6 

1 

-8 

-4 


0 

0 

0 

0 


Por lo tanto, x\ = — 1 + íx¡, x -2 = 2, xo = 2 y X 3 es libre. Como un vector, la solución ge¬ 
neral de Ax = b tiene la forma 



XI 


— 1 + |x3 


"-1 " 


5X3 


"-1" 


" 4 “ 

3 

X = 

X 2 

= 

2 

= 

2 

+ 

0 

= 

2 

+ X3 

0 


*3 


V 3 


0 


*3 


0 


1 


t t 

P v 


La ecuación x = p + xjy, o, escribiendo t como un parámetro general, 

x = p + ív (f en IR) (3) 

describe el conjunto solución de Ax = b en forma vectorial paramétrica. Recuerde del ejem¬ 
plo 1 que el conjunto solución de Ax = 0 tiene la ecuación vectorial paramétrica 


x = t\ (;t en R) 


( 4 ) 


[con la misma v que aparece en (3)]. Así, las soluciones de Ax = b se obtienen sumando el 
vector p a las soluciones de Ax = 0. El propio vector p es justamente una solución particular 
de Ax = b [correspondiente a t = 0 en (3)]. ■ 


L + p 



FIGURA 4 

Recta trasladada. 


Para describir el conjunto solución de Ax = b en forma geométrica, podemos pensar que 
la suma vectorial es una traslación. Dados v y p en R 2 o R 3 , el efecto de sumar p a v es mover 
a v en una dirección paralela a la recta que pasa por p y 0. Se dice que p traslada a v hacia v 
+ p. Véase la figura 3. Si cada punto sobre la recta L en R 2 o R 3 es trasladado por un vector 
p, el resultado es una recta paralela a L. Véase la figura 4. 

Suponga que L es la recta que pasa por 0 y v, descrita mediante la ecuación (4). Sumar 
p a cada punto sobre L produce la recta trasladada que describe la ecuación (3). Observe 
que p está sobre la recta en la ecuación (3). Así, (3) es la ecuación de la recta que pasa 
por p paralela a v. Entonces el conjunto solución de Ax = b es una recta que pasa por p 
paralela al conjunto solución de Ax = 0 . La figura 5 ilustra este caso. 



FIGURA 5 Conjuntos solución paralelos de 
Ax = b y Ax = 0. 


La relación entre los conjuntos solución de Ax = b y Ax = 0, que se ilustra en la figura 
5, se generaliza a cualquier ecuación consistente Ax = b, aunque el conjunto solución será 
más grande que una recta cuando existan muchas variables libres. El siguiente teorema da el 
enunciado preciso. Para una demostración, véase el ejercicio 25. 
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1 0 R E M A 6 Suponga que la ecuación Ax = b es consistente para alguna b dada, y sea p una solu¬ 
ción. El conjunto solución de Ax = b es el conjunto de todos los vectores de la forma 
w = p + v/„ donde v/, es cualquier solución de la ecuación homogénea Ax = 0. 


El teorema 6 dice que si Ax = b tiene una solución, entonces el conjunto solución se 
obtiene al trasladar el conjunto solución de Ax = 0, empleando cualquier solución particular 
p de Ax = b para dicha traslación. La figura 6 ilustra el caso en que existen dos variables 
libres. Aun cuando n > 3, nuestra imagen mental del conjunto solución de un sistema con¬ 
sistente Ax = b (con b A 0) es un solo punto diferente de cero, o una recta o un plano que no 
pasan por el origen. 



FIGURA 6 Conjuntos solución 
paralelos de Ax = b y Ax = 0. 


Advertencia: El teorema 6 y la figura 6 solamente se aplican a una ecuación Ax = b que tiene 
al menos una solución p diferente de cero. Cuando Ax = b no tiene solución, entonces el 
conjunto solución es vacío. 

El siguiente algoritmo resume los cálculos que se muestran en los ejemplos 1, 2 y 3. 


ESCRITURA DE UN CONJUNTO SOLUCIÓN (DE UN SISTEMA CONSISTENTE) 

EN FORMA VECTORIAL PARAMÉTRICA 

1. Reduzca por filas la matriz aumentada a su forma escalonada reducida. 

2. Exprese cada variable básica en términos de cualquiera de las variables libres pre¬ 
sentes en una ecuación. 

3. Escriba una solución típica x como un vector cuyas entradas dependen de las varia¬ 
bles libres (si las hay). 

4. Descomponga x en una combinación lineal de vectores (con entradas numéricas) 
empleando las variables libres como parámetros. 


PROBLEMAS DE PRÁCTICA 

1. Cada una de las siguientes ecuaciones determina un plano en IR 3 . ¿Se intersecan los dos 
planos? Si es así, describa su intersección 

X\ + 4 .T 2 — 5 a '3 = 0 
2 xi — X2 + 8x3 = 9 


2. Escriba la solución general de 10 xi — 3x2 — 2x3 = 7 en forma vectorial paramétrica, y 
relacione el conjunto solución con el obtenido en el ejemplo 2. 
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1.5 EJERCICIOS 

En los ejercicios 1 a 4, determine si el sistema tiene una solución no 
trivial. Intente usar lo menos posible las operaciones de fila. 

1. 2x¡ — 5x 2 + 8x 3 = 0 2. .\'i — 2x 2 + 3x 3 = 0 

—2xi — 7x 2 + x 3 = 0 —2xi — 3 x 2 — 4x 3 = 0 

4xi + 2 x 2 + 7x 3 = 0 2xí — 4x 2 + 9x 3 = 0 

3. — 3xj 4- 4x 2 — 8x3 = 0 4. 5.\'i — 3x 2 + 2x 3 = 0 

— 2xi + 5x 2 + 4x 3 = 0 —3xí — 4x 2 + 2x 3 = 0 

En los ejercicios 5 y 6, siga el método de los ejemplos 1 y 2 para es¬ 
cribir el conjunto solución del sistema homogéneo en forma vectorial 
paramétrica. 

5. 2xi + 2x 2 + 4 x 3 = 0 6 . xi + 2 x 2 — 3x3 = 0 

—4xi — 4 x 2 — 8x3 = 0 2xi + x 2 — 3x3 = 0 

— 3x 2 — 3 x 3 = 0 — lxi + x 2 =0 

En los ejercicios 7 a 12. describa todas las soluciones de Ax = 0 
en forma vectorial paramétrica, donde A es equivalente por filas a 
la matriz dada. 



1 -4 -2 0 3 -5' 

0 0 1 0 0 -1 

0 0 0 0 1 -4 

0 0 0 0 0 0 _ 

' 1 -2 3 -6 5 0' 

12 0 0 0 1 4 -6 

0 0 0 0 0 1 

0 0 0 0 0 0 _ 

13. Suponga que el conjunto solución de un cierto sistema de ecua¬ 
ciones lineales se describe como xi = 5 + 4 x' 3 , x 2 = —2 — lx 2 , 
con X 3 libre. Use vectores para describir este conjunto como una 
recta en R 3 . 

14. Suponga que el conjunto solución de un cierto sistema de 
ecuaciones lineales se describe como x¡ = 5 x 4 , x 2 = 3 — 2 x 4 , 
X 3 = 2 + 5 x 4 , con X 4 libre. Utilice vectores para describir este 
conjunto como una “recta” en R 4 . 

15. Describa y compare los conjuntos solución de xq + 5x 2 — 3x 2 = 0 
yxi + 5 x 2 — 3 x 3 = —2. 

16. Describa y compare los conjuntos solución de xq — 2x 2 + 3x3 = 0 
y xj — 2x 2 + 3 x 3 = 4. 

17. Siga el método del ejemplo 3 para describir las soluciones del 
siguiente sistema en forma vectorial paramétrica. También, dé 
una descripción geométrica del conjunto solución y compárelo 
con el que obtuvo en el ejercicio 5. 

2 xq + 2x 2 + 4 x 3 = 8 

—4xq — 4 x 2 — 8 x 3 = —16 
— 3x 2 — 3x 3 = 12 



18. Como en el ejercicio 17, describa las soluciones del siguiente 
sistema en forma vectorial paramétrica, y realice una compara¬ 
ción geométrica con el conjunto solución del ejercicio 6. 

xq + 2 x 2 — 3x3 = 5 

2xq + x 2 — 3x3 = 13 
— x\ + x 2 = —8 

En los ejercicios 19 y 20, encuentre la ecuación paramétrica de la 
recta que pasa por a y es paralela a b. 

». » = [“§]-•> = [ _ a] 2 «- "-[- 2 ] 

En los ejercicios 21 y 22, obtenga una ecuación paramétrica de la 
recta M que pasa a través de p y q. [Sugerencia: M es paralela al 
vector q — p. Véase la figura que aparece más abajo], 

r 3 i r 4 1 „„ r —31 r °i 

21 . p = _3 , q = | 22 . p = 2 ’ q = -3 


x 2 



En los ejercicios 23 y 24, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. 

23. a) Una ecuación homogénea siempre es consistente. 

b) La ecuación Ax = 0 da una descripción explícita de su con¬ 
junto solución. 

c) La ecuación homogénea Ax = 0 tiene la solución trivial si 
y solo si la ecuación tiene al menos una variable libre. 

d ) La ecuación x = p + t\ describe una recta que pasa por v 
y es paralela a p. 

e) El conjunto solución de Ax = b es el conjunto de todos los 
vectores de la forma w = p + V/„ donde V/, es cualquier so¬ 
lución de la ecuación Ax = 0. 

24. a) Un sistema homogéneo de ecuaciones puede ser inconsis¬ 

tente. 

b) Si x es una solución no trivial de Ax = 0, entonces cada 
entrada en x es distinta de cero. 

c) El efecto de sumar p a un vector es mover a dicho vector 
en una dirección paralela a p. 

d) La ecuación Ax = b es homogénea si el vector cero es una 
solución. 
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é) Si Ax — b es consistente, entonces el conjunto solución 
de Ax = b se obtiene por traslación del conjunto solución de 
Ax = 0. 

25. Demuestre el teorema 6: 

a) Suponga que p es una solución de Ax = b, de manera que 
Ap = b. Sea v* cualquier solución de la ecuación homo¬ 
génea Ax = 0, y sea w = p + v*. Demuestre que w es una 
solución de Ax = b. 

b) Sea w cualquier solución de Ax = b, y defina V;, = w — p. 
Demuestre que v/, es una solución de Ax = 0. Esto demues¬ 
tra que cada solución de Ax = b tiene la forma w = p + v*, 
donde p es una solución particular de Ax = b y V/, una 
solución de Ax = 0. 

26. Suponga que A es la matriz cero de 3 x 3 (con cero en todas 
las entradas). Describa el conjunto solución de la ecuación 
Ax = 0. 

27. Suponga que Ax = b tiene una solución. Explique por qué la 
solución es única precisamente cuando Ax = 0 tiene solo la so¬ 
lución trivial. 


En los ejercicios 28 a 31, a) ¿la ecuación Ax = 0 tiene una solución 
no trivial? b) ¿La ecuación Ax = b tiene al menos una solución para 
toda posible b? 

28. A es una matriz de 3 x 3 con tres posiciones pivote. 

29. A es una matriz de 4 x 4 con tres posiciones pivote. 

30. A es una matriz de 2 x 5 con dos posiciones pivote. 


31. A es una matriz de 3 x 2 con dos posiciones pivote. 

32. Si b A 0, ¿el conjunto solución de Ax = b puede ser un plano 
que pasa por el origen? Explique su respuesta. 


33. Construya una matriz A. diferente de cero, de 3 x 3 tal que el 


vector 


1 

1 

1 


sea una solución de Ax = 0. 


34. Construya una matriz A, diferente de cero, de 3 x 3 tal que el 


vector 


2 

-1 

1 


sea una solución de Ax = 0. 


35. A partir de A = 



-3 

21 

-6 


, encuentre por inspección una 


solución no trivial de Ax = 0. [Sugerencia: Piense en la ecua¬ 
ción Ax = 0 escrita como una ecuación vectorial]. 


36. A partir de A 



encuentre por inspección una 


solución no trivial de Ax = 0. 


37. Construya una matriz A de 2 x 2 tal que el conjunto solución 
de la ecuación Ax = 0 sea la recta en IR 2 que pasa a través de 
(4, 1) y el origen. Luego, encuentre un vector b en IR 2 tal que 
el conjunto solución de Ax = b no sea una recta en IR 2 paralela 
al conjunto solución de Ax = 0. ¿Por qué esto no contradice al 
teorema 6? 

38. Sean A una matriz de m x n, y w un vector en IR" que satisface 
la ecuación Ax = 0. Demuestre que para cualquier escalar c, 
el vector cw también satisface Ax = 0. [Es decir, demuestre 
queA(cw) = 0], 

39. Suponga que A es una matriz de m x n, y que v y w son 
vectores en IR" tales que Av = 0 y Aw = 0. Explique por 
qué A(v + w) debe ser el vector cero. Luego, explique 
por qué A(cv + dw) = 0 para cada par de escalares c y d. 

40. Suponga que A es una matriz de 3 x 3 y b es un vector en IR 3 
tales que la ecuación Ax = b no tiene solución. ¿Existe un 
vector y en IR 3 tal que la ecuación Ax = y tiene una solución 
única? Justifique su respuesta. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Reduzca por filas la matriz aumentada: 


' 1 4-5 

0' 


' 1 4 

-5 

0' 


' 1 

0 

3 4" 

2-1 8 

9 


0 -9 

18 

9 


0 

1 

-2 -1 


X\ + 3 .T 3 = 4 

X 2 — 2.V3 = — 1 

Por lo tanto, X\ = 4 — 3 x 3 , x '2 = — 1 + 2 x 3 , con X 3 libre. La solución general en forma 
vectorial paramétrica es 


X] 


4 - 3 x 3 


4" 


~— 3 ~ 

x 2 

= 

— 1 2^3 

= 

-1 

+ X3 

2 

*3 


X 3 


0 


1 


t t 

P v 


La intersección de los dos planos es la recta que pasa por p en la dirección de v. 
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2. La matriz aumentada [T 0 —3 —2 7] es equivalente por filas a [ 1 —.3 —.2 .7], 

y la solución general es x\ = .7 + . 3 x 2 + - 2 x 3 , con X 2 y X 3 libres. Es decir, 



XI 


.7 -f- .3X2 “b .2x'3 


".7 


".3 


~. 2 ~ 

X = 

*2 

= 

*2 

= 

0 

+ X2 

1 

+ X-j 

0 


_* 3 _ 


*3 


0 


0 


1 





= 

P 

+ 

x 2 u 

+ 

X3V 


El conjunto solución de la ecuación no homogénea Ax = b es el plano trasladado 
p + Gen {u, v}, que pasa por p y es paralelo al conjunto solución de la ecuación homo¬ 
génea del ejemplo 2 . 


1.6 | APLICACIONES DE SISTEMAS LINEALES 

Tal vez usted espere que un problema de la vida real que implica álgebra lineal tenga solo una 
solución, o quizá ninguna solución. La finalidad de esta sección es mostrar cómo, de manera 
natural, surgen sistemas lineales con muchas soluciones. Aquí las aplicaciones provienen de 
áreas como economía, química y flujo en redes. 


Un sistema homogéneo en economía 


WEB 


El sistema de 500 ecuaciones con 500 variables, que se mencionó en la introducción de este 
capítulo, ahora se conoce como un modelo de “entrada-salida” (o “producción”) de Leontief . 1 
En la sección 2.6 se examinará este modelo con más detalle, cuando se disponga de más bases 
teóricas y de una mejor notación. Por ahora, se considerará un “modelo de intercambio” más 
sencillo, que también se debe a Leontief. 

Suponga que la economía de una nación se divide en muchos sectores, como manufactu¬ 
ra, comunicaciones, entretenimiento y servicios. Considere que se conoce la producción total 
anual de cada sector y se sabe exactamente cómo esta producción se divide o se “intercambia” 
entre los otros sectores de la economía. Al valor total en dólares de la producción de un sector 
se le llama precio de esa producción. Leontief probó el siguiente resultado. 


Existen precios de equilibrio que se pueden asignar a las producciones totales de 
varios sectores, de tal forma que el ingreso de cada sector equilibra exactamente 
sus gastos. 


El siguiente ejemplo ilustra cómo encontrar los precios de equilibrio. 


EJ EM PLO 1 Suponga que una economía comprende las industrias carbonífera, eléctrica 
y del acero, y que la producción de cada sector se distribuye entre los diversos sectores como 
se muestra en la tabla 1, página 50: las entradas en una columna representan las partes frac¬ 
ciónales de la producción total de un sector industrial. 

La segunda columna de la tabla 1, por ejemplo, dice que la producción total del sector 
eléctrico se divide como sigue: 40% a la industria del carbón, 50% a la del acero, y el restante 
10% a la industria eléctrica. (El sector eléctrico trata a este 10% como un gasto en el que se 
incurre con la finalidad de operar su negocio). Como se deben considerar todas las produc¬ 
ciones, las fracciones decimales en cada columna deben sumar 1 . 


1 Véase Wassily W. Leontief. "Input-Output Economics”, Scientific American, octubre de 1951. pp. 15-21. 



50 CAPÍTULO 1 Ecuaciones lineales en álgebra lineal 


.1 


Energía eléctrica 



.2 


Denote los precios (es decir, valores en dólares) del total de las producciones anuales 
de los sectores del carbón, eléctrico y del acero mediante pe , Pe y Ps, respectivamente. Si es 
posible, encuentre los precios de equilibrio que hacen que los ingresos de cada sector igualen 
a sus gastos. 



TABLA 1 Una economía básica 


Distribución de la producción por sectores: 


Del carbón 

Eléctrico 

Del acero 

Comprada por: 

.0 

.4 

.6 

S. del carbón 

.6 

.1 

.2 

S. eléctrico 

.4 

.5 

.2 

S. del acero 


SOLUCIÓN En cada columna se indica hacia dónde va la producción de cada sector indus¬ 
trial; si deseamos saber qué necesita cada sector como insumos, hay que leer a lo largo de 
cada fila. Por ejemplo, la primera fila de la tabla 1 dice que el sector del carbón recibe (y paga) 
el 40% de la producción del sector eléctrico y el 60% del producto de la industria del acero. 
Puesto que los respectivos valores de las producciones totales sonp E yps, la industria del carbón 
debe gastar Ap E dólares por compartir el producto del sector eléctrico y , 6 p$ por la produc¬ 
ción de la industria del acero. Así, los gastos totales del sector carbonífero son Ap E + .6p$. 
Para hacer que el ingreso de la industria del carbón, pe, sea igual a sus gastos, escribimos 

p c = Ap E + ,6p s (1) 

La segunda fila de la tabla de intercambio indica que el sector eléctrico gasta 0 . 6 pc en 
la industria del carbón, 0 . 1 /?e en energía eléctrica, y 0 . 2 p$ en la industria del acero. Así que 
el requerimiento de ingreso/gasto para el sector eléctrico es 

p E = , 6 p c + A Pe + .2 p s (2) 

Finalmente, la tercera fila de la tabla de intercambio conduce al último requerimiento: 

p s = Ap c + .5 p E + . 2 p s (3) 

Para resolver el sistema de ecuaciones (1), (2) y (3), se transfieren todas las incógnitas a los 
lados izquierdos de las ecuaciones y se combinan términos semejantes. [Por ejemplo, en 
el lado izquierdo de (2), se escribe p E — ■ I Pe como .9/? E .] 


Pc ~ A Pe - -6p s = 0 
~.6p c + .9p E - .2p s = 0 
—Apc — ■5pE + -8ps = 0 

El siguiente paso es reducir por filas. Aquí, para simplificar, los decimales se redondean 
a dos cifras. 


1 

-.4 

-.6 

0 " 


" 1 

-.4 

-.6 

0 


" 1 

-.4 

-.6 


0 

.6 

.9 

-.2 

0 

~ 

0 

.66 

-.56 

0 


0 

.66 

-.56 


0 

.4 

-.5 

.8 

0 


0 

-.66 

.56 

0 



0 

0 

0 


0 





" 1 

-.4 

-.6 

0" 


r 

1 

0 - 

.94 

0 





~ 

0 

1 - 

-.85 

0 

~ 

0 

1 - 

.85 

0 






0 

0 

0 

0 


0 

0 

0 

0 
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La solución general es pe = .94ps, Pe = .85/?s, y Ps es libre. El vector de precios de equili¬ 
brio para la economía tiene la forma 


Pe 


,94p s 


".94" 

Pe 

= 

• 85/> s 

= Ps 

.85 

_PS_ 


Ps 


1 


Cualquier asignación (no negativa) para ps da por resultado una asignación de precios de 
equilibrio. Por ejemplo, si se toma ps como 100 (o $100 millones), entonces pe = 94 y 
Pe = 85. Los ingresos y gastos de cada sector serán iguales si la producción de carbón 
se cotiza en $94 millones, la de energía eléctrica en $85 millones, y la de acero en $100 
millones. ■ 

Balanceo de ecuaciones químicas 

Las ecuaciones químicas describen las cantidades de sustancias que se consumen y producen 
en reacciones químicas. Por ejemplo, cuando el gas propano se quema, el propano (C 3 Hg) se 
combina con oxígeno (O 2 ) para formar dióxido de carbono (CO 2 ) y agua (LLO), de acuerdo 
con una ecuación de la forma 

(X|)C 3 H 8 + (x 2 )0 2 -> (x 3 )C0 2 + (x 4 )H 2 0 (4) 

Para “balancear” esta ecuación, un químico debe encontrar números X 4 tales que los 

números totales de átomos de carbón (C), hidrógeno(H) y oxígeno (O) en el lado izquierdo 
concuerden con los números de átomos correspondientes en el lado derecho (porque, en la 
reacción, los átomos no se crean ni se destruyen). 

Un método sistemático para balancear ecuaciones químicas es colocar una ecuación vec¬ 
torial que describa el número de átomos de cada tipo presentes en una reacción. Como la 
ecuación (4) implica a tres tipos de átomos (carbón, hidrógeno y oxígeno), construya un 
vector en R 3 para cada reactante y producto en (4) que liste los números de “átomos por mo¬ 
lécula”, como sigue: 



"3" 


"0 


1 " 


"0 

-* Carbón 

C 3 H 8 : 

8 

, 0 2 : 

0 

, C0 2 : 

0 

, H 2 0: 

2 

Hidrógeno 


0 


2 


2 


1 

-> Oxígeno 


Para balancear la ecuación (4), los coeficientes jci,_, jc 4 deben satisfacer 



"3 


"0 


T 


"o" 

•U 

8 

+ x 2 

0 

= *3 

0 

+ X4 

2 


0 


2 


2 


1 


Para resolver, mueva todos los términos a la izquierda (cambiando los signos en los vectores 
tercero y cuarto): 



"3 


"0" 


"-1 " 


0" 


"0" 

Xl 

8 

+ x 2 

0 

+ X3 

0 

+ x 4 

-2 

= 

0 


0 


2 


-2 


-1 


0 


La reducción por filas de la matriz aumentada para esta ecuación conduce a la solución 
general 

X] = i.v 4 , x 2 = |x 4 , x 3 = |X 4 , con x 4 libre 

Como los coeficientes en una ecuación química deben ser enteros, tome x 4 = 4; en tal caso, 
X\ = 1, x 2 = 5 y x 3 = 3. La ecuación balanceada es 

C 3 H 8 + 50 2 -> 3C0 2 + 4H 2 0 

La ecuación también estaría balanceada si, por ejemplo, cada coeficiente se duplicara. Sin 
embargo, para la mayoría de los propósitos, los químicos prefieren utilizar una ecuación ba¬ 
lanceada cuyos coeficientes sean los números más pequeños posibles. 



52 CAPITULO 1 


Ecuaciones lineales en álgebra lineal 


WEB 


- > x \ 

30 —>- 

- > x 2 

FIGURA 1 

Una unión, también llamada nodo. 


Flujo de redes 

Los sistemas de ecuaciones lineales se originan naturalmente cuando científicos, ingenie¬ 
ros o economistas estudian el flujo de alguna cantidad a través de una red. Por ejemplo, 
los planificadores urbanos y los ingenieros de tráfico monitorizan el patrón de flujo de 
tránsito en una rejilla de las calles de la ciudad. Los ingenieros eléctricos calculan el flujo 
de corriente a través de circuitos eléctricos. Y los economistas analizan la distribución de 
productos del fabricante al consumidor a través de una red de mayoristas y minoristas. Para 
muchas redes, los sistemas de ecuaciones implican cientos o incluso miles de variables y 
ecuaciones. 

Una red consiste en un conjunto de puntos llamados uniones, o nodos, con líneas o arcos 
llamados ramas, que conectan algunos o todos los nodos. Se indica la dirección y el sentido 
de flujo en cada rama, y la cantidad de flujo (o tasa) se denota con una variable. 

La suposición básica en el flujo de red es que el flujo total en la red es igual al flujo 
total de salida de la red, y que el flujo total en un nodo es igual al flujo total de salida en 
dicho nodo. Por ejemplo, la figura 1 muestra 30 unidades que fluyen por una rama hacia 
una unión; x¡ y X 2 denotan los flujos de salida del nodo a través de otras ramas. Como el 
flujo se “conserva” en cada unión, entonces x¡ + X 2 = 30. En forma similar, el flujo en cada 
nodo se describe mediante una ecuación lineal. El problema de análisis de redes es deter¬ 
minar el flujo en cada rama cuando se tiene información parcial (como el flujo de entrada 
y salida de la red). 

EJEMPLO 2 La red de la figura 2 representa el flujo del tránsito (en vehículos por hora) 
en varias calles de un solo sentido en el centro de Baltimore en un día común, poco después 
del mediodía. Determine el patrón de flujo general para la red. 


*3 


too 


300 -4- 


Calvert St. 


Lombard St. 


300 ->- 


Pratt St. 


South St. 


x 4 


500 


í 


N 


-<-400 


->600 


FIGURA 2 Calles de Baltimore. 


SOLUCIÓN Escriba las ecuaciones que describen el flujo, y después encuentre la solución 
general del sistema. Marque las intersecciones de las calles (nodos) y los flujos desconocidos 
en las ramas, como se indica en la figura 2. En cada intersección, iguale el flujo de entrada 
al de salida. 


Intersección 

Flujo de entrada 

Flujo de salida 

A 

300 + 500 

= X\ + X 2 

B 

X 2 + X 4 

— 300 + x-¡ 

C 

100 + 400 

= X 4 + X¡ 

D 

X\ + *5 

= 600 
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También, el flujo total de entrada en la red (500 + 300 + 100 + 400) es igual al flujo total 
de salida (300 + X 3 + 600), que se simplifica a X 3 = 400. Combine esta ecuación con un 
reordenamiento de las primeras cuatro ecuaciones para obtener el siguiente sistema de 
ecuaciones: 


x\ + X 2 = 800 

X 2 — X 3 + X 4 = 300 

X 4 + X 5 = 500 

x\ + X 5 = 600 

X 3 = 400 


La reducción por filas de la matriz aumentada conduce a 

Xi + x¡ = 600 

X 2 — X 5 = 200 

X 3 = 400 

X 4 + X 5 = 500 

El patrón de flujo general para la red está descrito por 


x\ = 600 — X 5 
X 2 = 200 + x¡ 

• X 3 = 400 
X 4 = 500 — X 5 
x¡ es libre 

Un flujo negativo en una rama de la red corresponde a un flujo en el sentido opuesto 
al indicado en el modelo. Como las calles en este problema son de un solo sentido, ninguna 
de las variables puede ser negativa. Este hecho conduce a ciertas limitaciones sobre los po¬ 
sibles valores de las variables. Por ejemplo, 500 porque X 4 no puede ser negativa. En el 
problema de práctica 2 se consideran otras restricciones sobre las variables. ■ 


PROBLEMAS DE PRÁCTICA 

1. Suponga que una economía tiene tres sectores: agricultura, minería y manufactura. Agri¬ 
cultura vende el 5% de su producción a minería y el 30% a manufactura, y retiene el resto. 
Minería vende el 20% de su producto a agricultura y el 70% a manufactura, conservando 
el resto. Manufactura vende el 20% de su producción a agricultura y el 30% a minería, 
y retiene lo restante. Determine la tabla de intercambio para esta economía; utilice las 
columnas para describir cómo la producción de cada sector se intercambia entre los tres 
sectores. 

2. Considere el flujo de red que se analizó en el ejemplo 2. Determine el posible rango de 
valores de X\ y X 2 - [ Sugerencia: El ejemplo mencionó que x 5 ’ 500. ¿Qué implicaciones 
tiene esto sobre x\ y xi ? Además, considere el hecho de que x 5 3= 0 ], 
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1.6 EJERCICIOS 

1. Suponga que una economía solo tiene dos sectores: bienes y 
servicios. Cada año, el sector de bienes vende el 80% de su pro¬ 
ducción al de servicios y retiene el resto, mientras que el sector 
de servicios vende el 70% de su producción al sector de bienes 
y conserva lo restante. Encuentre los precios de equilibrio para 
las producciones anuales de los sectores de bienes y servicios 
que permiten igualar el ingreso con el gasto de cada sector. 



2. Encuentre otro conjunto de precios de equilibrio para la econo¬ 
mía del ejemplo 1. Suponga la misma economía, pero que ahora 
se utiliza el yen japonés en vez del dólar estadounidense para 
medir los valores de las diversas producciones de los sectores. 
¿Esto modificaría el problema en algún sentido? Analícelo. 

3. Considere una economía con tres sectores: combustibles y ener¬ 
gía, manufactura y servicios. Combustibles y energía vende el 
80% de su producción a manufactura, el 10% a servicios, y re¬ 
tiene el resto. Manufactura vende el 10% de su producción a 
combustibles y energía, el 80% a servicios, y conserva lo res¬ 
tante. Servicios vende el 20% a combustible y energía, el 40% 
a manufactura, y retiene el resto. 

a) Construya la tabla de intercambio para esta economía. 

b) Desarrolle un sistema de ecuaciones que permita determi¬ 
nar los precios con los cuales se igualen los ingresos y gas¬ 
tos de cada sector. Después, escriba la matriz aumentada 
que puede reducirse por filas para obtener esos precios. 

c) [M] Encuentre un conjunto de precios de equilibrio cuando el 
precio para la producción de servicios es de 100 unidades. 

4. Suponga que una economía tiene cuatro sectores: minero, ma¬ 
derero, de energía y del transporte. Minería vende el 10% de 
su producción al sector maderero, el 60% a energía, y conserva 
el resto. El sector maderero vende el 15% de su producción a 
minería, el 50% a energía, el 20% al sector del transporte, y 
conserva lo restante. Energía vende el 20% de su producción a 
minería, el 15% al sector maderero, el 20% al sector del trans¬ 
porte, y retiene el resto. El sector del transporte vende el 20% de 
su salida de producción a minería, el 10% al sector maderero, el 
50% a energía, y conserva lo restante. 

a) Construya la tabla de intercambio para esta economía. 

b) [M] Encuentre un conjunto de precios de equilibrio para esta 
economía. 

5. Una economía tiene cuatro sectores: agricultura, manufactura, 
servicios y transporte. El sector agrícola vende el 20% de su 
producción a manufactura, el 30% a servicios, el 30% al sector 
del transporte, y conserva el resto. Manufactura vende el 35% 
de su producción al sector agrícola, el 35% a servicios, el 20% 


al sector del transporte, y conserva el resto. Servicios vende el 
10% de su salida de producción a agricultura, el 20% a manu¬ 
factura, el 20% al sector del transporte, y conserva el resto. El 
sector del transporte vende el 20% de su salida de producción a 
agricultura, el 30% a manufactura, el 20% a servicios, y conser¬ 
va el remanente. 

a) Construya la tabla de intercambio para esta economía. 

b) [M] Encuentre un conjunto de precios de equilibrio para la 
economía si el valor del producto del sector del transporte 
es de $10.00 por unidad. 

c) El sector de servicios lanza una exitosa campaña para “comer 
productos frescos de granja”, e incrementa su participación 
con el sector agrícola al 40%, mientras que su participa¬ 
ción con el sector manufacturero cae al 10%. Construya la 
tabla de intercambio para esta nueva economía. 

d) [M] Encuentre un conjunto de precios de equilibrio para esta 
nueva economía si el valor del sector del transporte continúa 
a $10.00 por unidad. ¿Qué efectos tuvo la campaña de “co¬ 
mer productos frescos de granja” sobre los precios de equili¬ 
brio para los sectores en esta economía? 

En los ejercicios 6 a 11, balancee las ecuaciones químicas utilizando 
el enfoque de ecuación vectorial analizado en esta sección. 

6. El óxido de aluminio y el carbón reaccionan para crear el ele¬ 
mento aluminio y dióxido de carbono: 

A1 2 0 3 + C -> Al + C0 2 

[Para cada compuesto, construya un vector que liste los núme¬ 
ros de átomos de aluminio, oxígeno y carbón], 

7. El Alka-Seltzer contiene bicarbonato de sodio (NaHC0 3 ) y áci¬ 
do cítrico (H3C6IT5O7). Cuando se disuelve una tableta en agua, 
la siguiente reacción produce citrato de sodio, agua y dióxido de 
carbono (gas): 

NaHC0 3 + H 3 C 6 H 5 0 7 Na 3 C 6 H 5 0 7 + H 2 0 + C0 2 

8. La piedra caliza, CaC0 3 , neutraliza el ácido, EI 3 0, en la lluvia 
ácida, mediante la siguiente ecuación sin balancear: 

H 3 0 + CaC0 3 H 2 0 + Ca + C0 2 

9. El sulfhídrico de boro reacciona violentamente con agua para 
formar ácido bórico y gas sulfhídrico de hidrógeno (que expide 
olor a huevo podrido). La ecuación sin balancear es 

B 2 S 3 + H 2 0 -> h 3 bo 3 + H 2 S 

10. [M] Si es posible, utilice aritmética exacta o un formato racional 
para los cálculos al balancear la siguiente reacción química: 

PbNó + ( r\ 1 ii 2 ( )\ —> Pb 3 C>4 + Cr 2 0 3 + Mn0 2 + NO 

11. [M] La reacción química que aparece a continuación se puede 
utilizar en algunos procesos industriales, como la producción de 
arsénico (AsH 3 ). Utilice aritmética exacta o un formato racional 
para los cálculos al balancear esta ecuación. 

MnS + As 2 Crio0 3 5 + EESO4 

HMn0 4 + AsH 3 + CrS 3 0 12 + H 2 0 
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12. Encuentre el patrón de flujo general de la red que se ilustra en la 
figura. Suponiendo que todos los flujos son no negativos, ¿cuál 
es el valor más pequeño posible para *4? 


*-100 





13. a) Encuentre el patrón de flujo general de la red que se ilustra 
en la figura. 

b ) Suponiendo que los flujos deben ser en los sentidos indica¬ 
dos, encuentre los flujos mínimos en las ramas denotadas 
como X 2 , xj, X 4 y x¡. 


30 40 



14. a) Encuentre el patrón de tráfico general de la red de autopistas 


que se representa en la figura. (Las tasas de flujo están en 
vehículos/minuto). 

b) Describa el patrón de tráfico general cuando está cerrada la 
ruta cuyo flujo es x¡. 

c) Cuando x¡ = 0, ¿cuál es el valor mínimo de X 4 I 



15. En Inglaterra las intersecciones con frecuencia se construyen 
como circuitos en forma de glorieta de un solo sentido, como el 
que se ilustra en la figura. Suponga que el tráfico debe circular 
en los sentidos indicados. Encuentre la solución general del flu¬ 
jo de red. Determine el valor más pequeño posible para x¿. 



SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Escriba los porcentajes como decimales. Como todas las salidas deben tomarse en cuenta, 
cada columna debe sumar 1. Este hecho ayuda a llenar cualquier entrada faltante. 


Distribución de la producción por sectores: 

Agricultura 

Minería 

Manufactura 

Comprada por: 

.65 

.20 

.20 

Agricultura 

.05 

.10 

.30 

Minería 

.30 

.70 

.50 

Manufactura 


2. Como X 5 < 500, las ecuaciones D y A para x\ y xo implican que xi > 100 y X 2 ^ 700. 
El hecho de que 15 > 0 implica que xi < 600 y xo & 200. Así, 100 < < 600, y 

200 < x 2 < 700. 


1.7 


INDEPENDENCIA LINEAL 


Las ecuaciones homogéneas de la sección 1.5 se pueden estudiar desde una perspectiva dife¬ 
rente si las escribimos como ecuaciones vectoriales. De esta manera, la atención se transfiere 
de las soluciones desconocidas de Ax = 0 a los vectores que aparecen en las ecuaciones 
vectoriales. 
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Por ejemplo, considere la ecuación 



■ 1 " 


"4" 


" 2 " 


~ 0 ~ 

X\ 

2 

+ X2 

5 

+ X3 

1 

= 

0 


3 


6 


0 


0 


Esta ecuación tiene una solución trivial, desde luego, donde X\ = xo = X3 = 0. Al igual que 
en la sección 1.5, el asunto principal es si la solución trivial es la única. 


DEFINICIÓN 

Se dice que un conjunto indexado de vectores ¡Vi,..., v,,} 
pendiente si la ecuación vectorial 

en R" es linealmente inde- 


x\x \ + X 2 V 2 + ••• + x p x p = 0 



solo tiene la solución trivial. Se dice que el conjunto {vi,... 
diente si existen pesos ci,...,c p , no todos cero, tales que 

, \p ¡ es linealmente depen¬ 


C1V1 + C2V2 + ••• + CpXp = 0 

dí 


La ecuación (2) se llama relación de dependencia lineal entre vi,.. x p cuando no todos 
los pesos son cero. Un conjunto indexado es linealmente dependiente si y solo si no es lineal¬ 
mente independiente. Por brevedad, puede decirse que vi,..., \ p son linealmente dependientes 
cuando queremos decir que {Vi,..., \ p ] es un conjunto linealmente dependiente. Se utiliza una 
terminología semejante para los conjuntos linealmente independientes. 



_ 1 " 


"4" 


" 2 " 

EJEMPLO 1 Seanvi = 

2 

, v 2 = 

5 

y v 3 = 

1 


3 


6 


0 


a ) Determine si el conjunto { Vi, V2, V3} es linealmente independiente. 

b) Si es posible, encuentre una relación de dependencia lineal entre vi, V 2 y V3. 

SOLUCIÓN 

a) Se debe determinar si existe una solución no trivial de la ecuación (1) que aparece más 
arriba. Las operaciones de fila sobre la matriz aumentada asociada indican que 


" 1 

4 

2 

0 


"1 

4 

2 

0 " 

2 

5 

1 

0 


0 

-3 

-3 

0 

3 

6 

0 

0 


0 

0 

0 

0 


Como es evidente, x¡ y X2 son variables básicas, y Xj es libre. Cada valor de x? distinto de 
cero determina una solución no trivial de (1). Así que Vi, V 2 , V 3 son linealmente depen¬ 
dientes (y, por tanto, no son linealmente independientes). 

b) Para encontrar una relación de dependencia lineal entre v¡, V 2 y V 3 , se reduce por filas 
completamente a la matriz aumentada y se escribe el nuevo sistema: 

"1 0-2 0 

0 110 
0 0 0 0 

Así, X\ = 2x3, x 2 — — X 3 , y a '3 es libre. Seleccione cualquier valor distinto de cero para xy, 
por ejemplo, X 3 = 5. De esta manera, x\ = 10 y X 2 = —5. Sustituya estos valores en la 
ecuación ( 1 ) para obtener 

10 vi - 5 v2 + 5 v 3 = 0 


x\ — 2 x 3 = 0 

X2 + X3 = 0 

0 = 0 


Esta es una (entre una infinidad) de las posibles relaciones de dependencia lineal entre 
vi, v 2 y v 3 . ■ 
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Independencia lineal de las columnas de una matriz 

Suponga que, en vez de utilizar un conjunto de vectores, se inicia con una matriz 
A = [ai • • • a,,]. En tal caso, la ecuación matricial Ax = 0 se puede escribir como 

x\&\ + X 2&2 + ••• + x n a„ = 0 

Cada relación de dependencia lineal entre las columnas de A corresponde a una solución 
no trivial de Ax = 0. Así, tenemos el siguiente resultado importante. 


Las columnas de una matriz A son linealmente independientes si y solo si la ecuación 
Ax = 0 tiene solo la solución trivial. (3) 


EJEMPLO 2 


Determine si las columnas de la matriz A = 


0 

1 

5 


1 4 

2 -1 
8 0 


son lineal¬ 


mente independientes. 


SOLUCIÓN Para estudiar Ax = 0, se reduce por filas la matriz aumentada: 


"0 

1 

4 

0 


■ 1 

2 

-1 

0 " 


■ 1 

2 

-1 

0 " 

1 

2 

-1 

0 

~ 

0 

1 

4 

0 

~ 

0 

1 

4 

0 

5 

8 

0 

0 


0 

-2 

5 

0 


0 

0 

13 

0 


En este punto, es claro que hay tres variables básicas y ninguna variable libre. Así, la 
ecuación Ax = 0 solo tiene la solución trivial, y las columnas de A son linealmente inde¬ 
pendientes. ■ 


Conjuntos de uno o dos vectores 

Un conjunto que solo tiene un vector —por ejemplo, v— es linealmente independiente si 
y solo si v no es el vector cero. Esto se debe a que la ecuación vectorial X\\ — 0 solo tiene 
la solución trivial cuando v A 0. El vector cero es linealmente dependiente porque x 1 0 = 0 
tiene muchas soluciones no triviales. 

El siguiente ejemplo explicará la naturaleza de un conjunto linealmente dependiente de 
dos vectores. 


EJEMPLO 3 Determine si los siguientes conjuntos de vectores son linealmente inde¬ 
pendientes. 



'3' 


'6' 


'3' 


"6' 

Vi = 

1 

, v 2 = 

2 

b) vi = 

2 

, v 2 = 

2 


SOLUCIÓN 

a) Observe que Vt es un múltiplo de V|, a saber, V 2 = 2\\. Así que, — 2vi + V 2 = 0, lo 
que muestra que {vi, V 2 } es linealmente dependiente. 

b ) Desde luego, los vectores Vi y V 2 no son múltiplos entre sí. ¿Podrían ser linealmente de¬ 
pendientes? Suponga que c y d satisfacen 

cvi + d\ 2 = 0 


Si c A 0, entonces es posible despejar V| en términos de V 2 , a saber, V| = {—d/c)\ 2 . 
Este resultado es imposible porque Vi no es múltiplo de V 2 . Así que c debe ser cero. 
De manera similar, d también debe ser cero. Por lo tanto, {vi, V 2 } es un conjunto lineal¬ 
mente independiente. ■ 
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( 6 , 2 ) 


( 3 , 1 ) 


Linealmente dependientes 


( 3 , 2 ) ( 6 , 2 ) 


Linealmente independientes 

FIGURA 1 


Los argumentos del ejemplo 3 indican que siempre es posible determinar por inspección 
cuándo un conjunto de dos vectores es linealmente dependiente. Las operaciones de fila son 
innecesarias. Basta con comprobar si al menos uno de los vectores es un escalar multiplicado 
por el otro. (La prueba solo se aplica a conjuntos de dos vectores). 


Un conjunto de dos vectores {vi, V 2 } es linealmente dependiente si al menos uno de 
los vectores es un múltiplo del otro. El conjunto es linealmente independiente si y solo 
si ninguno de los vectores es un múltiplo del otro. 


En términos geométricos, dos vectores son linealmente dependientes si y solo si am¬ 
bos están sobre la misma recta que pasa por el origen. La figura 1 muestra los vectores del 
ejemplo 3. 

Conjuntos de dos o más vectores 


La prueba del siguiente teorema es similar a la solución del ejemplo 3. Los detalles se presen¬ 
tan al final de esta sección. 


TEOREMA 7 Caracterización de conjuntos linealmente dependientes 

Un conjunto indexado S = {v 1 ,..., v ;) } de dos o más vectores es linealmente dependien¬ 
te si y solo si al menos uno de los vectores en S es una combinación lineal de los otros. 
De hecho, si S es linealmente dependiente y v¡ A 0, entonces alguna v ¡ (con j > 1) es 
una combinación lineal de los vectores precedentes. Vi,..., V/-i. 


Advertencia: El teorema 7 no dice que cada vector en un conjunto linealmente dependiente 
es una combinación lineal de los vectores precedentes. Un vector en un conjunto linealmente 
dependiente puede no ser combinación lineal de los otros vectores. Véase el problema de 
práctica 3. 


EJEMPLO 4 Sean u = 

"3 

1 

y v = 

T 

6 


0 


0 


. Describa 


y explique por qué un vector w está en Gen ¡u, v} si y 
dependiente. 


el conjunto generado por u y v, 
solo si {u, v, w} es linealmente 


SOLUCIÓN Los vectores u y v son linealmente independientes porque ninguno de ellos 
es múltiplo del otro, de manera que generan un plano en R 3 . (Véase la sección 1.3). De hecho, 
Gen {u, v} es el plano X\X 2 (con X 3 = 0). Si w es una combinación lineal de u y v, enton¬ 
ces {u, v, w¡ es linealmente dependiente, de acuerdo con el teorema 7. A la inversa, su¬ 
ponga que {u, v, w} es linealmente dependiente. Por el teorema 7, algún vector en {u, v, w¡ 
es una combinación lineal de los vectores precedentes (porque u A 0). Ese vector debe ser w, 
porque v no es múltiplo de u. Así, w está en Gen {u, v}. Véase la figura 2. ■ 



Linealmente dependientes, 
w en Gen {u, v} 

FIGURA 2 Dependencia lineal en U 3 . 


Linealmente independientes, 
w no está en Gen {u, v} 
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El ejemplo 4 se generaliza a cualquier conjunto {u, v, w} en IR 3 con u y v linealmente 
independientes. El conjunto {u, v, w} será linealmente dependiente si y solo si w está en el 
plano generado por u y v. 

Los siguientes dos teoremas describen casos especiales en los cuales la dependencia 
lineal de un conjunto es automática. Aún más, el teorema 8 será un resultado clave para tra¬ 
bajar en capítulos posteriores. 


TEOREMA 8 



p 


* * 
* * 
* * 


Si un conjunto contiene más vectores que entradas en cada vector, entonces el con¬ 
junto es linealmente dependiente. Es decir, cualquier conjunto {Vi,_, v /; ¡ en R" es li¬ 

nealmente dependiente si p > n. 


FIGURA 3 

Si p > n, las columnas son 
linealmente dependientes. 


(-2, 2) 

(2 ; t) 


(4,-1) 

FIGURA 4 


Un conjunto linealmente 

dependiente 

en IR 2 . 


TEOREMA 


DEMOSTRACIÓN Sea A = [vi ••• v ; ,]. Entonces, A es n x p, y la ecuación Ax = 0 co¬ 

rresponde a un sistema de n ecuaciones con p incógnitas. Si p > n, hay más variables que 
ecuaciones, por lo que debe existir una variable libre. Así, Ax = 0 tiene una solución no 
trivial, y las columnas de A son linealmente dependientes. Véase la figura 3 para una versión 
matricial de este teorema. ■ 


Advertencia: El teorema 8 no dice nada acerca del caso en que el número de vectores en el 
conjunto no excede el número de entradas en cada vector. 


EJEMPLO 5 


Los vectores 



son linealmente dependientes de acuerdo 


con el teorema 8, ya que hay tres vectores en el conjunto y solamente existen dos entradas en 
cada vector. Sin embargo, observe que ninguno de los vectores es un múltiplo de alguno de 
los otros. Véase la figura 4. ■ 


Si un conjunto S = {vi,..., \ p | en R" contiene al vector cero, entonces el conjunto es 
linealmente dependiente. 


DEMOSTRACIÓN Al renumerar los vectores, se puede suponer que vi = 0. Así, la ecuación 
lvi + 0v2 + ••• + 0v ; , = 0 indica que S es linealmente dependiente. ■ 


EJEMPLO 6 Por inspección, determine si el conjunto dado es linealmente dependiente. 




" r 


"2" 


"3 


"4” 


"2" 


"0 


T 

a) 

7 

, 

0 

, 

1 

, 

1 

b) 

3 

, 

0 

, 

i 


6 


9 


5 


8 


5 


0 


8 


SOLUCIÓN 

a) El conjunto contiene cuatro vectores, cada uno de los cuales tiene solamente tres entradas. 
Así que, de acuerdo con el teorema 8, el conjunto es linealmente dependiente. 

b ) El teorema 8 no se aplica aquí porque el número de vectores no excede al número de 
entradas en cada vector. Como el vector cero se encuentra en el conjunto, este último es 
linealmente dependiente, de acuerdo con el teorema 9. 

c) Compare las entradas correspondientes de los dos vectores. El segundo vector parece ser 

el primer vector multiplicado por —3/2. La relación es válida para los primeros tres pares 
de entradas, pero falla para el cuarto par. Así, ninguno de los vectores es múltiplo de otro 
y, por lo tanto, son linealmente independientes. ■ 
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En general, la sección se debería leer varias veces para asimilar plenamente un concepto 
tan importante como el de independencia lineal. Las notas en la Guía de estudio para esta 
sección ayudarán a construir imágenes mentales de las principales ideas de álgebra lineal. Por 
ejemplo, es importante leer con cuidado la siguiente demostración, ya que ilustra cómo se 
emplea la definición de independencia lineal. 

DEMOSTRACIÓN DEL TEOREMA 7 (Caracterización de conjuntos linealmente 
dependientes) Si alguna v,- en S es una combinación lineal de los demás vectores, entonces 
Yj se puede restar en ambos lados de la ecuación, produciendo así una relación de dependencia 
lineal con un peso diferente de cero (—1) sobre v ; . [Por ejemplo, si = C2V2 + C3V3, entonces 
0 = (— 1 )vi + C2V2 + C3V3 + OV4 + • • • + Ovy,.]. Por lo tanto, S es linealmente dependiente. 

A la inversa, suponga que S es linealmente dependiente. Si Vi es cero, entonces es una 
combinación lineal (trivial) de los demás vectores en S. De otra forma, Vi A 0, y existen pesos 
Cu---, c p , sin que todos sean cero, tales que 


C1V1 + C2V2 + ••• + CpYp = 0 


Sea j el subíndice más grande para el cual Cj A 0. Si j = 1, entonces c 1 v 1 = 0, lo que es im¬ 
posible porque A 0. De manera que j > 1, y 


C1V1 -I - h CjYj + 0v/ + i -I- 1 - 0v^ = 0 

CjYj = -cqvj- Cj-iVj-i 



PROBLEMAS DE PRÁCTICA 



3" 


"-6 


0 


r 31 

Sean u = 

2 

-4 

, v = 

1 

7 

, w = 

-5 

2 

y z = 

1 

r- ir) 

1 

_ 1 


1. Determine si los siguientes conjuntos son linealmente independientes y explique por qué: 
{u, v},{u, w¡,{u, z¡,{v, w[,{v, z} y {w, z}. 

2. ¿Las respuestas al problema 1 implican que {u, v, w, z} es linealmente independiente? 

3. Para determinar si {u, v, w, z} es linealmente dependiente, ¿es aconsejable comprobar 
si, por ejemplo, w es una combinación lineal de u, v y z? 

4. ¿El conjunto {u, v, w, z ¡ es linealmente dependiente? 


1.7 EJERCICIOS 


En los ejercicios 1 a 4, determine si los vectores son linealmente 
independientes. Justifique cada respuesta. 



' 5 “ 


7 “ 


' 9 " 


"0~ 


0“ 


'-1' 

1. 

0 

, 

2 

, 

4 

2. 

2 


0 


3 


0 


-6 


-8 


3 


-8 


1 



En los ejercicios 5 a 8, determine si las columnas de la matriz forman 
un conjunto linealmente independiente. Justifique sus respuestas. 



6 . 


-4 

0 

1 

2 


-3 

-1 

1 

1 


0 

5 

-5 


-10 



1 

4 

-3 

0" 


1 

-2 

3 

2' 

7 . 

-2 

-7 

5 

1 

8. 

-2 

4 

-6 

2 


-4 

-5 

7 

5 


0 

1 

-1 

3 


En los ejercicios 9 y 10, a) ¿para qué valores de h está V3 en 
Gen ¡vi, V2), y b) ¿para qué valores de h el conjunto {vi, V2, V3} 
es linealmente dependiente ? Justifique sus respuestas. 
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1 ~ 


"-3“ 


5 

9. vi = 

-3 

2 

r n 

, v 2 = 

9 

-6 

"-3~ 

, v 3 = 

-7 

h 

2 ~ 

10. Vi = 

1 

1 1 

L/l 

1_ 

, V 2 = 

9 

15 

. V 3 = 

-5 

h 


En los ejercicios 11 a 14. encuentre el valor o valores de h para 
los cuales los vectores son linealmente dependientes. Justifique sus 
respuestas. 



2 “ 


4“ 


'- 2 " 


3" 


"- 6 ~ 


' 9 

11 . 

-2 

, 

-6 

, 

2 

12 . 

-6 

, 

4 


h 


4 


7 _ 


h 


1 


_ —3 _ 


_ 3_ 


1 ' 


"- 2 “ 


3" 


1 ' 


'-3“ 


~2~ 

13. 

5 


-9 

, 

h 

14. 

-2 

, 

7 

, 

1 


-3 


6 


-9 


-4 


6 


h 


Por inspección, determine si los vectores en los ejercicios 15 a 20 
son linealmente independientes. Justifique sus respuestas. 



En los ejercicios 21 y 22, marque cada enunciado como verdadero 
o falso. Justifique cada respuesta con base en una cuidadosa lectura 
del texto. 


21. a) Las columnas de una matriz A son linealmente independien¬ 

tes si la ecuación Ax = 0 tiene la solución trivial. 

b ) Si S es un conjunto linealmente dependiente, entonces cada 
vector es una combinación lineal de los otros vectores en S. 

c ) Las columnas de cualquier matriz de 4 x 5 son linealmente 
dependientes. 

d) Si x y y son linealmente independientes, y si {x, y, z¡ es 
linealmente dependiente, entonces z está en Gen {x, y}. 

22. a) Si u y v son linealmente independientes, y si w está en 

Gen {u, v}, entonces ¡u, v, w) es linealmente dependiente. 

b ) Si tres vectores en IR 3 están en el mismo plano en IR 3 , enton¬ 
ces son linealmente dependientes. 

c) Si un conjunto contiene menos vectores que entradas en 
los vectores, entonces el conjunto es linealmente indepen¬ 
diente. 

d) Si un conjunto en IR" es linealmente dependiente, entonces 
el conjunto contiene más de n vectores. 

En los ejercicios 23 a 26. describa las posibles formas escalonadas de 
la matriz. Utilice la notación del ejemplo 1 de la sección 1.2. 

23. A es una matriz de 2 x 2 con columnas linealmente depen¬ 
dientes. 


25. A es una matriz de 4 x 2, A = [ai 82 ], y ai no es múltiplo 
de ai. 

26. A es una matriz de 4 x 3, A = [ai ai 83 ], tal que [ai, a^} es 
linealmente independiente y a 3 no está en Gen [ai, 82 ). 

27. ¿Cuántas columnas pivote debe tener una matriz de 6 x 4 si 
sus columnas son linealmente independientes? ¿Por qué? 

28. ¿Cuántas columnas pivote debe tener una matriz de 4 x 6 si sus 
columnas generan a IR 4 ? ¿Por qué? 

29. Construya matrices A y B de 3 x 2 tales que Ax = 0 tenga 
una solución no trivial, pero Bx = 0 tenga solamente la solu¬ 
ción trivial. 


30. a) Llene el espacio del siguiente enunciado: “Si A es una matriz 
de m x n, entonces las columnas de A son linealmente inde¬ 
pendientes si y solo si A tiene_columnas pivote”. 

tí) Explique por qué es verdadero el enunciado en a). 


Los ejercicios 31 y 32 deberían resolverse sin efectuar operaciones 
de fila. [Sugerencia: Escriba Ax = 0 como una ecuación vectorial]. 


31. A partir de A = 


2 

-5 

-3 

1 


3 

1 

-1 

0 


5 

-4 

-4 

1 


observe que la tercera co¬ 


lumna es la suma de las dos primeras. Encuentre una solución 
no trivial de Ax = 0. 


32. A partir de A = 


4 

-2 

-2 


3 

-2 

-3 


-5 

4 

7 


, observe que la primera 


columna menos la segunda multiplicada por 3 es igual a la ter¬ 
cera columna. Determine una solución no trivial de Ax = 0. 


En los ejercicios 33 a 38 cada enunciado es verdadero (en todos los 
casos) o falso (para al menos un ejemplo). Si es falso, idee un ejem¬ 
plo específico para demostrar que el enunciado no siempre es válido. 
Tal ejemplo se llama contraejemplo del enunciado. Si un enunciado 
es verdadero, dé una justificación. (Un ejemplo específico no puede 
explicar por qué un enunciado siempre es verdadero. Aquí es necesa¬ 
rio realizar más trabajo que en los ejercicios 21 y 22). 

33 . Si vi,..., V4 están en IR 4 , y V3 = 2 vi + V2, entonces {vi, V2, V3, V4¡ 
es linealmente dependiente. 

34 . Si vi y V2 están en IR 4 y V2 no es un múltiplo escalar de Vi, en¬ 
tonces {vi, V2} es linealmente independiente. 

35 . Si Vi,...,V5 están en IR 5 y V3 = 0 , entonces [vi, V2, V3, V4, V5) 
es linealmente dependiente. 

36 . Si vi, V2, V3 están en IR 3 y V3 no es combinación lineal de vi, V2, 
entonces [vi, V2. V3) es linealmente independiente. 

37 . Si vi,_, V4 están en IR 4 , y [vi, V2, V3¡ es linealmente depen¬ 

diente, entonces [vi, V2, V3, V4¡ también es linealmente de¬ 
pendiente. 

38 . Si [vi,.. .,V4} es un conjunto linealmente independiente de 
vectores en IR 4 , entonces {vi, V2, V3} también es linealmente 
independiente. [Sugerencia: Piense en X|V| + X2V2 + X3V3 + 
0 ■ v 4 = 0], 


24. A es una matriz de 3 x 3 con columnas linealmente inde¬ 
pendientes. 


39. Suponga que A es una matriz de m x n tal que para toda b 
en IR " 1 la ecuación Ax = b tiene, a lo sumo, una solución. 
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Use la definición de independencia lineal para explicar por 
qué las columnas de A deben ser linealmente independientes. 

40 . Suponga que una matriz A de m x n tiene n columnas pivote. 
Explique por qué para cada b en IR'" la ecuación Ax = b tiene, 
a lo sumo, una solución. [Sugerencia: Explique por qué Ax = b 
no puede tener un número infinito de soluciones]. 

[M] En los ejercicios 41 y 42, utilice tantas columnas de A como 
sea posible para construir una matriz B tal que la ecuación Bx = 0 
sólo tenga la solución trivial. Para comprobar su trabajo, resuelva 


Bx = 0. 

3 

—4 

10 

7 

-4 

41 . A = 

-5 

-3 

-7 

-11 

15 

4 

3 

5 

2 

1 


8 

—7 

23 

4 

15 


12 

10 

-6 

8 

4 

-14 

-7 

-6 

4 

-5 

-7 

9 

9 

9 

-9 

9 

9 

-18 

-4 

-3 

-1 

0 

-8 

1 

8 

7 

-5 

6 

1 

-11 


43 . [M] Con Ay B del ejercicio 41, seleccione una columna v de A 
que no se haya utilizado en la construcción de 6 y determine si 
v está en el conjunto generado por las columnas de B. (Describa 
sus cálculos). 

44 . [M] Repita el ejercicio 43 con las matrices A y B del ejerci¬ 
cio 42. Luego, dé una explicación del resultado, suponiendo que 
B se construyó de acuerdo con las especificaciones. 



SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Sí. En cada caso, ningún vector es múltiplo del otro. Por lo tanto, cada conjunto es lineal¬ 
mente independiente. 

2. No. La observación en el problema de práctica 1, por sí misma, no dice nada sobre la 
independencia lineal de {u, v, w, z}. 

3. No. Cuando se comprueba la independencia lineal, por lo general es poco útil la idea 
de comprobar si un vector seleccionado es una combinación lineal de los demás. Puede 
ocurrir que el vector seleccionado no sea una combinación lineal de los otros y, aun así, 
el conjunto entero de vectores sea linealmente dependiente. En este problema de práctica, 
w no es una combinación lineal de u, v y z. 

4. Sí, de acuerdo con el teorema 8. Existen más vectores (cuatro) que entradas (tres) en 
ellos. 


1.81 INTRODUCCIÓN A LAS TRANSFORMACIONES LINEALES 


La diferencia entre una ecuación matricial Ax = b y la ecuación vectorial asociada 
x&i + ■■■ + x„a„ = b es tan solo cuestión de notación. Sin embargo, es posible encontrar 
una ecuación matricial Ax = b en álgebra lineal (y en aplicaciones como gráficos genera¬ 
dos por computadora y procesamiento de señales) que no esté directamente relacionada con 
combinaciones lineales de vectores. Esto sucede cuando se piensa en la matriz A como un 
objeto que “actúa” sobre un vector x multiplicándolo para producir un nuevo vector Ax. 

Por ejemplo, en las ecuaciones 


4 -3 1 

2 0 5 


t 

A 


3 

1 


1 

1 

1 

1 

t 

X 



se observa que la multiplicación por A transforma a x en b, y transforma a u en el vector cero. 
Véase la figura 1. 
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multiplicación 
por A 

multiplicación 
por A 




FIGURA 1 Transformación de vectores por 
medio de multiplicación matricial. 


Desde este nuevo punto de vista, resolver la ecuación Ax = b equivale a encontrar todos 
los vectores x en R 4 que se transforman en el vector b en IR 2 como resultado de la “acción” 
de la multiplicación por A. 

La correspondencia de x a Ax es una función de un conjunto de vectores a otro. Este con¬ 
cepto generaliza la noción común de una función como una regla que transforma un número 
real en otro. 

Una transformación (o función o mapeo) T de R" a R'" es una regla que asigna a cada 
vector x en R" un vector T(x) en R'". El conjunto R” se llama el dominio de T, y R'" se llama 
el codominio de T. La notación T : R" —» R m indica que el dominio de T es R" y que el co- 
dominio es R'". Para x en R", el vector T(x) en R m es la imagen de x (bajo la acción de T). 
El conjunto de todas las imágenes T(x) es el rango de T. Véase la figura 2. 


Dominio 



FIGURA 2 Dominio, codominio y rango 
de T : IR" -> IR"'. 


Es muy importante la nueva terminología de esta sección porque un enfoque dinámico 
del producto matriz-vector es la clave para entender diversas ideas en álgebra lineal, y para 
construir modelos matemáticos de sistemas físicos que evolucionan en el tiempo. Estos siste¬ 
mas dinámicos se analizarán en las secciones 1.10, 4.8 y 4.9, así como en el capítulo 5. 


Transformaciones matriciales 

Lo que resta de esta sección se centra en mapeos asociados con la multiplicación matricial. 
Para cada x en R", T(x) se calcula como Ax, donde A es una matriz de m x n. Para simpli¬ 
ficar, algunas veces esta transformación matricial se denota como x hh> Ax. Observe que el 
dominio de T es R" cuando A tiene n columnas, y el codominio de T es R m cuando cada co¬ 
lumna de A tiene m entradas. El rango de T es el conjunto de todas las combinaciones lineales 
de las columnas de A, porque cada imagen T(x) es de la forma Ax. 




64 CAPÍTULO 1 Ecuaciones lineales en álgebra lineal 



1 

-3 


o " 


3 


"3" 

EJEMPLO 1 Sean A = 

3 

5 

, u = 

z 

-1 

, b = 

2 

, c = 

2 


-1 

7 



-5 


5 


, y defina 


una transformación T : IR 2 x R 3 por 7'(x) = Ax, de manera que 


X 2 

T (x) = Ax = 

1 

3 

-3" 

5 

X\ 

_ 

x\ - 3x 2 
3x\ + 5.v 2 



-1 

7 

%2 


— XI + 1X2 



a) Encuentre T(u), la imagen de u bajo la transformación T. 

b) Encuentre una x en R 2 cuya imagen bajo T sea b. 

c) ¿Hay más de una x cuya imagen bajo T sea b? 

d) Determine si c está en el rango de la transformación T. 

SOLUCIÓN 

a) Calcule 



1 

-3" 

0 "" 


5" 

Au = 

3 

5 

z 

-1 

= 

1 


-1 

7 


-9 


b) Resuelva 7Yx) = b para x. Es decir, resuelva Ax = b, o 


"1-3" 
3 5 

X\ 


3" 

2 

1 - 

^1 

1_ 

_X2 _ 


1 

LO 

1 

_1 


( 1 ) 


Empleando el método analizado en la sección 1.4, reduzca por filas la matriz aumen¬ 
tada: 


1 

-3 

3 


" 1 

-3 

3 


" 1 

-3 

31 


" 1 

0 

1.5" 

3 

5 

2 


0 

14 

-7 


0 

1 -.5 


0 

1 

-.5 

-1 

7 

-5 


0 

4 

-2 


0 

0 

0 


0 

0 

0 


( 2 ) 


Así que x\ = 1.5, X 2 = 
b dado. 


.5 y x = 


1.5 

-.5 


. La imagen de esta x bajo T es el vector 


c) Cualquier x cuya imagen bajo T es b debe satisfacer la ecuación (1). A partir de (2), es 
evidente que la ecuación (1) tiene una solución única, por lo que hay exactamente una x 
cuya imagen es b. 

d) El vector c está en el rango de T si c es la imagen de alguna x en R 2 , es decir, si c = T(x) 
para alguna x. Esto es justamente otra manera de preguntar si el sistema Ax = c es con¬ 
sistente. Para encontrar la respuesta, reduzca por filas la matriz aumentada: 


1 

-3 

3 


" 1 

-3 

3 


" 1 

-3 

3 


"1 

-3 

3" 

3 

5 

2 


0 

14 

-7 


0 

1 

2 


0 

1 

2 

-1 

7 

5 


0 

4 

8 


0 

14 

-7 


0 

0 

-35 


La tercera ecuación, 0 = —35, indica que el sistema es inconsistente. De manera que c 
no está en el rango de T. ■ 


La pregunta del ejemplo le) es un problema de unicidad para un sistema de ecuacio¬ 
nes lineales, traducido aquí al lenguaje de transformaciones lineales: ¿Es b la imagen de una 
única x en R"? De manera similar, el ejemplo le/) es un problema de existencia: ¿Existe 
una x cuya imagen sea c? 

Las siguientes dos transformaciones matriciales se pueden visualizar geométricamente. 
Ambas refuerzan el enfoque dinámico de una matriz como algo que transforma vectores en 
otros vectores. La sección 2.7 incluye otros interesantes ejemplos relacionados con los gráfi¬ 
cos generados por computadora. 
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FIGURA 3 

Una transformación proyección. 



borrego deformado por una 
transformación de trasquilado 


DEFINICIÓN 


1 0 o 

EJEMPLO 2 Si A = 0 1 0 

0 0 0 

puntos de IR 3 sobre el plano X\X 2 porque 


entonces la transformación x i-> Ax proyecta 


X\ 


'1 

0 

0" 

X\ 


Xl 

X2 

|-> 

0 

1 

0 

X2 

= 

X2 

*3 _ 


0 

0 

0 

_*3 _ 


0 


Véase la figura 3. 


EJEMPLO 3 Sea A = 


. La transformación T : R 2 —» R 2 definida por T(x) = Ax 


se llama una transformación de trasquilado. Se puede demostrar que si T actúa sobre cada 
punto del cuadrado 2x2 que se ilustra en la figura 4, entonces el conjunto de imágenes for¬ 
ma el paralelogramo sombreado. La idea fundamental es demostrar que T mapea segmentos 
de recta sobre segmentos de recta (como se muestra en el ejercicio 27) y después comprobar 
que los vértices del cuadrado se mapean sobre los vértices del paralelogramo. Por ejemplo, 


la imagen del punto u = 


" 0 " 


' 1 3' 

'0' 


'6' 


"2' 

2 

es T(u) = 

0 1 

2 

— 

2 

, y la imagen de 

2 



T deforma el cuadrado como si la parte superior de este se empujara 


hacia la derecha manteniendo fija la base. La transformación de trasquilado se presenta en 
física, geología y cristalografía. ■ 



Transformaciones lineales 

El teorema 5 de la sección 1.4 establece que si A es de m x n, entonces la transformación 
x i-> Ax tiene las propiedades 

A(u + v) = Au + Av y A(cu) = cAu 

para toda u, v en R" y todos los escalares c. Estas propiedades, expresadas en notación fun¬ 
cional, identifican a la más importante clase de transformaciones en álgebra lineal. 


Una transformación (o mapeo) T es lineal si: 

i. 7Tu + v) = 7'( u ) + T(y) para todas las u, v en el dominio de T\ 

ii. r(cu) = c7'(u ) para todos los escalares c y para todas las u en el dominio de T. 


Cada transformación matricial es una transformación lineal. En los capítulos 4 y 5 se 
analizarán importantes ejemplos de transformaciones lineales que no son transformaciones 
matriciales. 
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Las transformaciones lineales presentan las operaciones de suma vectorial y multiplica¬ 
ción escalar. La propiedad i dice que el resultado 7(u + v) de primero sumar u y v en IR" y 
después aplicar T es lo mismo que primero aplicar T a u y v, y luego sumar T( u) y 7'(v) en R"'. 
Esas dos propiedades conducen fácilmente a los siguientes útiles resultados. 


Si T es una transformación lineal, entonces 

7(0) = 0 


y 


T( cu + dv) = cL(u) + dT(y) 


para todos los vectores u, v en el dominio de T y para todos los escalares c, d. 


(3) 

(4) 


La propiedad (3) se deriva de la condición ii en la definición, porque 7X0) = 7(0u) = 
07Tu) = 0. La propiedad (4) requiere tanto de i como de ii: 

L(cu + dx) = 7’(cu) + T(dx) = cT( u) + dT(x) 

Observe que si una transformación satisface la ecuación (4) para cualesquiera u, v y c, d, 
entonces debe ser lineal. (Establezca c = d = 1 para preservación de la suma, y d = 0 para 
preservación de la multiplicación escalar). La aplicación repetida de (4) produce una útil 
generalización: 

7’(c 1 v 1 + ••• + c p x p ) = dTXvj) + ••• + c p T(Xp) (5) 

En física e ingeniería, la ecuación (5) se conoce como principio de superposición. Piense 
que Vi,..., x p son señales que entran a un sistema y T(x\),..., T(x p ) son las respuestas de ese 
sistema a las señales. El sistema satisface el principio de superposición si para cualquier 
entrada expresada como una combinación lineal de tales señales, la respuesta del sistema 
es la misma combinación lineal de las respuestas a las señales individuales. En el capítulo 4 
retomaremos esta idea. 

EJEMPLO 4 Dado un escalar r, defina 7’ : IR 2 —» R 2 por 7Yx) = rx. T se llama una con¬ 
tracción cuando 0 < r < 1, y una dilatación cuando r > 1. Sea r = 3, y demuestre que T 
es una transformación lineal. 

SOLUCIÓN Sean u, v en R 2 y sean c, d escalares. De esta forma, 

T(cu + dx) = 3 (cu + dx) Definición de T 

= 3cu +3 dx ¡ 

> Aritmética vectorial 

= c(3u) + d(3x) 

= cT( u) + dT(x) 

Así, T es una transformación lineal porque satisface (4). Véase la figura 5. ■ 



FIGURA 5 Una transformación de dilatación. 
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EJEMPLO 5 Defina una transformación 7": [R 2 —> [R 2 mediante 


T(x) = 


"0 

-r 

Xl 


x 2 

1 

0 

_x 2 _ 


X\ _ 


Encuentre las imágenes bajo T de u 




y u + v = 


6 

4 


SOLUCIÓN 


T( u) = 


o -r 

"4" 


"-1" 


"0 -1" 

'2' 


'-3' 

1 0 

1 

— 

4 

T(v) = 

1 0 

3 

— 

2 


T( u + v) 


'0 

-1" 

'6' 


'-4" 

1 

0 

4 


6 _ 


Observe que 7Xu + v), evidentemente, es igual a '/Tu) + 7Tv). En la figura 6 es claro que T 
hace girar a u, v y u + v en el sentido antihorario, en torno al origen, en un ángulo de 90°. 
De hecho, T transforma el paralelogramo entero determinado por u y v en el determinado por 
'/Tu)y '/'(v). (Véase el ejercicio 28). ■ 


7Tu + v) 

_ 

_ 

- 

n u) 

U + V 


• 

- 


T(r) 

- 

_ 

• 

I I 1 1 1 

u 

lililí 

1 1 1 1 1 

lililí 


FIGURA 6 Una transformación de rotación. 


El ejemplo final no es geométrico, sino que muestra cómo un mapeo lineal puede trans¬ 
formar un tipo de datos en otro. 


EJEMPLO 6 Una compañía fabrica dos productos, B y C. Utilizando los datos del ejem¬ 
plo 7 de la sección 1.3, construya una matriz de “costo unitario”, U = [b c], cuyas columnas 
describan los “costos por dólar de producción” para ambos bienes: 


Producto 


B 

C 


.45 

.40" 

Materiales 

.25 

.35 

Mano de obra 

.15 

.15 

Gastos indirectos 


Sea x = (xi, x¿) el vector de “producción”, correspondiente a x\ dólares del producto B y 
a Xi dólares del producto C, y defina T : IR 2 —» R 3 mediante 


".45 


".40 


Costo total de materiales 

.25 

+ X 2 

.30 

= 

Costo total de mano de obra 

.15 


.15 


Costo total de gastos indirectos 


El mapeo T transforma una lista de cantidades de producción (medidas en dólares) en una 
lista de costos totales. La linealidad de este mapeo se refleja de dos maneras: 

1. Si la producción se incrementa en un factor de, por ejemplo, 4, de x a 4x, entonces los 
costos se incrementarán por el mismo factor, de T(x) a 4'/Tx). 
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2. Si x y y son vectores de producción, entonces el vector de costo total asociado con 
la producción combinada x + y es precisamente la suma de los vectores de costo T(x) 
y T( y). ■ 


PROBLEMAS DE PRACTICA 

1. Suponga que T : R 5 —> R 2 y T(x) = Ax para alguna matriz A y para cada x en R 5 . ¿Cuántas 
filas y columnas tiene A? 


2. Sea A 


[i -!]■« 


una descripción geométrica de la transformación x Ax. 


3. El segmento de recta de 0 a un vector u es el conjunto de puntos de la forma fu, donde 
0£íí 1. Demuestre que una transformación lineal T mapea este segmento en el seg¬ 
mento entre 0 y 7T u). 


1.8 EJERCICIOS 


1. Sea A = 


q 2 , y defina T: IR 2 —» IR 2 por T(x) = Ax. 
Encuentre las imágenes bajo J de u = ^ y v = ^ . 


0 

0 


3 " 


0 | 0 

, U = 

6 

II 

>> 

0 0 i_ 


1 

SO 



Defina T : IR 3 —> IR 3 por T(x) = Ax. Encuentre 7Tu) y Tfv). 

En los ejercicios 3 a 6, con T definida por T(x) = Ax, encuentre un 
vector x cuya imagen bajo T sea b, y analice si x es único. 


"10-3 -2 

3. A = -3 1 6 , b = 3 

2 -2 -lj [-1 

'1 -2 3] [-6' 

4. A = 0 1 -3 ,b= -4 

2-56 -5 


c , r 1 -5 -7] . r —21 
5 -^=L-3 7 5 J ’ b = |_ —2 J 


6. A = 


7. Sea A una matriz de 6 x 5. ¿Qué valores de a y b permiten de¬ 
finir T : IR" —» IR 6 mediante T(x) = Ax? 

8. ¿Cuántas filas y columnas debe tener una matriz A para poder 
definir un mapeo de R 5 a R 7 con la regla T(x) = Ax? 

Para los ejercicios 9 y 10. encuentre todos los vectores x en R 4 que 
son mapeados en el vector cero por la transformación x i—> Ax para 
la matriz A dada. 

'1-3 5-5' 

9. A = 0 1-3 5 

2-4 4-4 


10. A = 


11. Sean b = 1 , y A la matriz del ejercicio 9. ¿b está en el 

0_ 

rango de la transformación lineal x >-» Ax? ¿Por qué? 


12. Sean b = 


, y A la matriz del ejercicio 10. ¿b está en 


el rango de la transformación lineal x i-> Ax? ¿Por qué? 

En los ejercicios 13 a 16, utilice un sistema de coordenadas rec¬ 
tangulares para graficar u = 2 ’ V = 4 ’ ^ SUS * m ^S enes bajo 

la transformación T dada. (Elabore un esquema grande y separado 
para cada ejercicio). Describa geométricamente lo que hace T a cada 
vector x en R : . 

!3. r ( x)=[-; _;][£ 

14 - r « = [o Ifl] 

ni r° 11 r x i 

T(x) =1^1 

rj,, , [0 OlTxi 

16 ‘ r(x) =[o 2_|UJ 

r 3" 

17. Sea T: R 2 —> R 2 una transformación lineal que mapea u = ' 

" 41 r 3 “I [-1] 

en 1 y mapea v = ^ en ^ • Considerando el hecho 

de que T es lineal, encuentre las imágenes bajo T de 2u, 3v y 
2u + 3v. 
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18. La figura muestra los vectores u, v y w, junto con las imá¬ 
genes T(u) y T(y) bajo la acción de una transformación lineal 
T : IR 2 —> IR 2 . Copie esta figura cuidadosamente, y dibuje la 
imagen de T( w) con la mayor exactitud posible. [Sugerencia: 
Primero, escriba w como una combinación lineal de u y v.] 




T(x) 


T( u) 


19. 



" 1" 


"0" 


" 2" 


"-f 

ei = 

0 

,e 2 = 

1 

• yi = 

_ 5 _ 

y y 2 = 

6_ 


y sea 


T: IR 2 —» IR 2 una transformación lineal que mapea en jq, y e 2 


en y 2 - Encuentre las imágenes de 


5 

-3 


y 


Xi 

X 2 


20 . 


Sean x = 


Xl 

X 2 


, Vi = 



7 

-2 


y sea T: IR 2 —> IR 2 


una transformación lineal que mapea x en jciVi + X 2 V 2 . Encuen¬ 
tre una matriz A tal que T(x) sea Ax para cada x. 


En los ejercicios 21 y 22, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. 


21. a) Una transformación lineal es un tipo especial de función. 

tí) Si A es una matriz de 3 x 5, y T es una transformación defi¬ 
nida por T(x) = Ax, entonces el dominio de Te s IR 3 , 
c) Si A es una matriz de m x n, entonces el rango de la trans¬ 
formación x 1 —* Ax es IR™. 

el) Cada transformación lineal es una transformación matricial. 
e) Una transformación T es lineal si y solo si 
JlAVi + c 2 v 2 ) = CiHvi) + c 2 7'(v 2 ) 

para cualesquiera vi y v 2 en el dominio de T y para todos los 
escalares cq y C 2 . 

22. a) El rango de la transformación x i-> Ax es el conjunto de to¬ 

das las combinaciones lineales de las columnas de A. 
tí) Cada transformación matricial es una transformación lineal. 

c) Si T : IR" —> IR'" es una transformación lineal y si c está en IR"', 
entonces una pregunta de unicidad es: “¿Está c en el rango 
de TV. 

d) Una transformación lineal preserva las operaciones de suma 
vectorial y multiplicación escalar. 

e) Una transformación lineal T : IR" —» IR'" siempre mapea el 
origen de IR" al origen de IR"'. 

23. Defina /: IR —> IR por f(x) = mx + b. 

a) Demuestre que/es una transformación lineal cuando b — 0. 

b) Encuentre una propiedad de una transformación lineal que 
se viole cuando b # 0. 

c) ¿Por qué/se llama una función lineal? 


24. Una transformación afín T : R" —» IR'" tiene la forma T(x) = Ax 
+ b, donde A es una matriz de m x n y b está en IR'". Demuestre 
que T no es una transformación lineal cuando b =£ 0. (Las trans¬ 
formaciones afines son importantes en los gráficos generados 
por computadora). 

25. Dados y # 0 y p en IR", la recta que pasa por p en la dirección 
de v tiene la ecuación paramétrica x = p + t\. Demuestre que 
una transformación lineal T : IR" —> IR" mapea esta recta sobre 
otra recta o sobre un solo punto (una recta degenerada). 

26. a) Demuestre que la recta que pasa por los vectores p y q 

en IR" se puede escribir en la forma paramétrica x = (1 — 
r)p + ?q. (Consulte la figura de los ejercicios 21 y 22 de 
la sección 1.5). 

tí) El segmento de recta de p a q es el conjunto de puntos de la 
forma (1 — r)p + íq para 0 £ t £ 1 (como que se muestra 
en la figura de abajo). Demuestre que una transformación 
lineal T mapea este segmento de recta sobre un segmento de 
recta o sobre un solo punto. 


(t = 0) p ^ T(q) 



(í=l)q 

27. Sean u y v vectores linealmente independientes en IR 3 , y sea P 
el plano que pasa por u, v y 0. La ecuación paramétrica de P es 
x = su + tx (con y, t en IR). Demuestre que una transformación 
lineal T 1 : IR 3 —>• IR 3 mapea P sobre un plano a través de 0, o sobre 
una recta que pasa por 0, o justo sobre el origen en IR 3 . ¿Qué se 
puede decir acerca de T(u) y 7\v) para que la imagen del plano 
P sea un plano? 

28. Sean u y v vectores en IR". Es posible demostrar que el conjun¬ 
to P de todos los puntos en el paralelogramo determinado por 
u y v tiene la forma uu + bx, para 0 Sa< l,0s6< 1. Sea 
r : IR" —> IR"' una transformación lineal. Explique por qué la 
imagen, bajo la transformación T, de un punto en P está en el 
paralelogramo determinado por J(u) y T{x). 

29. Sea T : IR 2 —y IR 2 la transformación lineal que refleja cada pun¬ 
to a través del eje x 2 . Elabore dos esquemas semejantes a la fi¬ 
gura 6 , que ilustren las propiedades i y ii de una transformación 
lineal. 

30. Suponga que los vectores vi,..., x p generan a IR", y que T : IR" —> IR" 
es una transformación lineal. Considere que T(x¡) = 0 para 
i = 1, •.., p. Demuestre que T es la transformación cero. Es decir, 
demuestre que si x es cualquier vector en IR", entonces T(x) = 0. 

31. Sea 7" : IR" —> IR'" una transformación lineal, y sea {vi, V 2 , V 3 } 
un conjunto linealmente dependiente en IR". Explique por qué 
el conjunto { 7Tvi ), T(v 2 ), HV 3 )} es linealmente dependiente. 

En los ejercicios 32 a 36, los vectores columna están escritos como 

filas, como x = (x\, x 2 ), y T(x) se escribe como T(x 1 , x 2 ). 

32. Demuestre que la transformación T definida por T(x¡, x 2 ) = 
(xi — 2 |* 2 |, x\ — 4x2) no es lineal. 

33. Demuestre que la transformación T definida por T(x¡, xf) = 
(xi — 2x 2 , X\ — 3, 2x\ — 5 x 2 ) no es lineal. 
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Sea T : IR 3 —> IR 3 la transformación que refleja a cada vector 


2 

3 

5 

-5" 


'3 

4 

-7 

0 ' 

x = (X\,X 2 ,X 3 ) a través del plano *3 = 0 sobre T(x) — (x\,X 2 , — ^ 3 ). 

37. 

-7 

7 

0 

0 

38. 

5 

-8 

7 

4 

Demuestre que T es una transformación lineal. [Para algunas 

-3 

4 

1 

3 

6 

-8 

6 

4 

ideas, véase el ejemplo 4], 


-9 

3 

—6 

-4 


9 

—1 

-2 

0 


35. Sea T : IR 3 —» IR 3 la transformación que proyecta a cada vector 
x = (x¡, X 2 , Xi) sobre el plano xi — 0, de manera que T(x) = 
(X], 0, x-}). Demuestre que T es una transformación lineal. 

36. Sea T : R" —> IR™ una transformación lineal. Suponga que {u, v) 
es un conjunto linealmente independiente, pero ¡Tíu), T(\)} es 
un conjunto linealmente dependiente. Demuestre que 7Tx) = 0 
tiene una solución no trivial. [Sugerencia: Considere el hecho 
de que CiZTu) + C 2 T(\) = 0 para algunos pesos c\ y C 2 , sin que 
ambos sean iguales a cero]. 


39. [M] Sea b = 


y sea A la matriz del ejercicio 37. 


7 
5 

l -3 j 

¿Está b en el rango de la transformación x Ax? Si es así, 
obtenga una x cuya imagen bajo la transformación sea b. 

" 4 " 


40. [M] Sea b = 


-4 

—4 

—1 


y sea A la matriz del ejercicio 38. 


[M] En los ejercicios 37 y 38, las matrices determinan una transfor¬ 
mación lineal T. Encuentre todas las x tales que T(x) = 0. 


¿Está b en el rango de la transformación x >-» Ax? Si así es, 
encuentre una x cuya imagen bajo la transformación sea b. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


V 

• 

lili 

Au 

• 

X 

• 

11 

lili 

Av 

111 

• Ax 


u 


La transformación x t-> Ax. 


1. A debe tener cinco columnas para que Ax esté definido. A debe tener dos filas para que 
el codominio de T esté en IR 2 . 

2. Dibuje algunos puntos aleatorios (vectores) sobre papel milimétrico para ver qué ocurre. 
Un punto como (4, 1) se mapea en (4, — 1). La transformación x h-> Ax refleja los puntos 
a través del eje x (o eje x{). 

3. Sea x = fu para alguna t tal que 0 < t < 1. Como T es lineal, entonces T(tu) = tT( u), 
que es un punto sobre el segmento de línea entre 0 y 7’( u). 


1.9] MATRIZ DE UNA TRANSFORMACIÓN LINEAL 


Siempre que una transformación lineal T se origina geométricamente o se describe con pa¬ 
labras, surge el deseo de tener una “fórmula” para T(x). El análisis que sigue muestra que 
cada transformación lineal de R" a R m en realidad es una transformación matricial x i-> Ax, 
y que importantes propiedades de T están íntimamente relacionadas con propiedades de A. 
La clave para encontrar A es observar que T está plenamente determinada por su acción so¬ 
bre las columnas de la matriz identidad den x n, 



«i = 


EJEMPLO 1 


Las columnas de / 2 = 


1 

0 ' 


"1" 


'0' 

0 

1 

son ei = 

0 

y e 2 = 

1 


. Suponga 


que T es una transformación lineal de R 2 a R 3 tal que 


HeO = 

5 

-7 

y 7Xe 2 ) = 

~-3" 

8 


2 


0 


Sin otra información adicional, encuentre una fórmula para la imagen de una x arbitraria 
en R 2 . 
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SOLUCIÓN Escriba 


x¡ 

*2 


= *1 


+ A 2 


= A'iej + x 2 e 2 


Como T es una transformación lineal, 

T(x) = xiT(ei) + x 2 T(e 2 ) 

5*i — 3x 2 
—7*1 + 8x 2 
2x\ + 0 


Al 

5 

-7 

+ a 2 

-3 

8 


2 


0 


( 1 ) 


( 2 ) 


El paso de la ecuación (1) a la ecuación (2) explica por qué el conocimiento de 7T e ¡) y 
T(e 2 ) es suficiente para determinar 7Tx) para cualquier x. Además, ya que (2) expresa a 7Yx) 
como una combinación lineal de vectores, podemos colocar esos vectores en las columnas 
de una matriz A y así escribir (2) como 


T(x) = [T(e l ) 


T(t 2 )] 


Al 

A 2 


Ax 


TEOREMA 10 Sea T : IR" —» R m una transformación lineal. Así, existe una única matriz A tal que 

T(x) = Ax para toda x en R" 

De hecho, A es la matriz de m x n cuyay-ésima columna es el vector 7'(e ; ). donde e, 
es la j-ésima columna de la matriz identidad en R": 

A = [7’(e 1 ) ••• 7’(e„)] (3) 


DEMOSTRACIÓN Escriba x = I„x = [ei ••• e„]x = .riei + ••• + x„e„, y utilice la linea- 
lidad de T para calcular 


T(x) = Tíx^! + -b x„e n ) = XiTid) +-b x„T(e„) 


= [ T(e¡) 


T(e„)] 


Al 


A n 


Ax 


En el ejercicio 33 nos ocuparemos de la unicidad de A. ■ 

La matriz A en (3) se llama matriz estándar para la transformación lineal T. 

Ahora se sabe que cada transformación lineal de R" a R”' puede verse como una transfor¬ 
mación matricial, y viceversa. El término transformación lineal se enfoca sobre una propie¬ 
dad de un mapeo, mientras que la transformación matricial describe cómo se implementa tal 
mapeo, lo que se ilustra en los ejemplos 2 y 3. 


EJEMPLO 2 Encuentre la matriz estándar A para la transformación de dilatación T(x) = 3x, 
para x en R 2 . 
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SOLUCIÓN Escriba 


nei) = 3e, 



y r(e 2 ) = 3e 2 



T 

0 

3 


EJEMPLO 3 Sea T : R 2 —> IR 2 la transformación que hace girar a cada punto de IR 2 alre¬ 
dedor del origen un ángulo i p, en sentido antihorario, si ip es positivo. Geométricamente, se 
podría demostrar que esta transformación es lineal. (Véase la figura 6 de la sección 1.8). 
Encuentre la matriz estándar A de esta transformación. 


SOLUCIÓN 


"1" 


eos Cp 


T 


— sen cp 

0 

gira a 

sen cp 

, y 

0 

gira a 

eos cp 


. Véase la figura 1. Por el teo¬ 


rema 10, 


A = 


eos cp 
sen cp 


— sen c p 
eos cp 


El ejemplo 5 de la sección 1.8 es un caso especial de esta transformación, con cp = 7 t/2 . ■ 


(- sen (p , eos (p) 

/ 

/ ypi 


( 0 , 1 ) 


\ 


(eos <p, sen ¡p) 


'W 1 


l 


KbO) 


\ / 

FIGURA 1 Una transformación de rotación. 


0 

1 


1 

0 


FIGURA 2 El cuadrado unitario. 


Transformaciones lineales geométricas de U 2 

Los ejemplos 2 y 3 ilustran transformaciones lineales que se describen geométricamente. 
Las tablas 1 a 4 muestran otras transformaciones lineales geométricas comunes del plano. 
Como las transformaciones son lineales, estas quedan completamente determinadas por su 
acción sobre las columnas de / 2 . En vez de solo mostrar las imágenes de ei y e 2 , las tablas 
indican cómo una transformación afecta a un cuadrado unitario (figura 2). 

Es posible construir otras transformaciones diferentes a partir de las listadas en las ta¬ 
blas 1 a 4; basta aplicar una transformación tras otra. Por ejemplo, un trasquilado horizontal 
podría ir seguido de una reflexión en el eje x 2 . La sección 2.1 mostrará que tal composición 
de transformaciones lineales es lineal. (También, véase el ejercicio 34). 


Preguntas de existencia y unicidad 

El concepto de transformación lineal ofrece una nueva manera de entender las preguntas de 
existencia y unicidad que se plantearon antes. Las dos definiciones que aparecen después 
de las tablas 1 a 4 aportan una terminología adecuada para las transformaciones. 
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TABLA 1 Reflexiones 


Transformación 


Imagen del cuadrado unitario Matriz estándar 


Reflexión a través del eje x\ 



Reflexión a través del eje X 2 


Reflexión a través de la recta xn = x\ 






Reflexión a través del origen 
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TABLA 2 Contracciones y expansiones 



Contracción 
y expansión 
vertical 



0 < k < 1 k > 1 


TABLA 3 Trasquilados 
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TABLA 4 Proyecciones 

Transformación Imagen del cuadrado unitario Matriz estándar 


Proyección sobre x 2 

el eje x\ ! 


1 0 
0 0 


0 

1 

1 

0 


0 


Proyección sobre x 2 

el eje X 2 I 


0 0 
0 1 


0 

1 


0 

0 


DEFINICIÓN Se dice que un mapeo T : R" —» R'" es sobre R m si cada b en R'" es la imagen de al 
menos una x en R". 


De manera equivalente, T es sobre R'" cuando todo el rango de T es codominio R'". 
Es decir, T mapea R" sobre R"' si, para cada b en el codominio R"', existe al menos una 
solución de T(x) = b. “¿T mapea R" sobre R" ! ?” es una pregunta de existencia. El mapeo T 
no es sobre cuando existe alguna b en R'" para la cual la ecuación 7Tx) = b no tiene solución. 
Véase la figura 3. 



T no es sobre R m 

FIGURA 3 ¿El rango de T es todo IR'"? 


V° ] 


i 11 * 


n¡° 



k'h 


T es sobre IR'” 


Se dice que un mapeo T : R” —» R m es uno a uno si cada b en R"' es la imagen de 
a lo sumo una x en R”. 


DEFINICION 
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De manera equivalente, T es uno a uno si, para cada b en IR'", la ecuación T(x) = b 
tiene una única solución o ninguna solución. “¿T es uno a uno?” es una pregunta de unicidad. 
El mapeo T no es uno a uno cuando algún b en R"' es la imagen de más de un vector en R". 
Si no existe tal b, entonces T es uno a uno. Véase la figura 4. 



T no es uno a uno T es uno a uno 


FIGURA 4 ¿Cada b es la imagen de a lo sumo un vector? 

Las transformaciones de proyección que se ilustran en la tabla 4 no son uno a uno y 
no mapean R 2 sobre R 2 . Las transformaciones en las tablas 1, 2 y 3 son uno a uno y sí mapean 
R 2 sobre R 2 . Otras posibilidades se muestran en los dos ejemplos siguientes. 

El ejemplo 4 y los teoremas que siguen muestran cómo las propiedades funcionales de 
ser un mapeo sobre y uno a uno están relacionadas con importantes conceptos estudiados 
antes en este capítulo. 

EJEMPLO 4 Sea T la transformación lineal cuya matriz estándar es 



¿L mapea R 4 sobre R 3 ? ¿T es un mapeo uno a uno? 

SOLUCION Como A está en forma escalonada, podemos ver a la vez que A tiene una posi¬ 
ción pivote en cada fila. De acuerdo con el teorema 4 de la sección 1.4, para cada b en R 3 , la 
ecuación Ax = b es consistente. En otras palabras, la transformación lineal T mapea R 4 (su 
dominio) sobre R 3 . Sin embargo, ya que la ecuación Ax = b tiene una variable libre (porque 
hay cuatro variables y solamente tres variables básicas), cada b es la imagen de más de una x. 
Es decir, T no es uno a uno. ■ 

TEOREMA 11 Sea T : R" —> R'" una transformación lineal. Entonces T es uno a uno si y solo si la 
ecuación T(x) = 0 tiene únicamente la solución trivial. 


DEMOSTRACIÓN Como T es lineal, 7(0) = 0. Si T es uno a uno, entonces la ecuación 
T(x) = 0 tiene a lo sumo una solución y, por lo tanto, solo la solución trivial. Si T no es uno 
a uno, entonces existe una b que es la imagen de al menos dos diferentes vectores en R", por 
ejemplo, u y v. Es decir, T( u) = b y T(v) = b. Pero, como T es lineal, 

T(u - v) = T(u) - T(\) = b - b = 0 


El vector u — v no es cero porque u =7= v. En consecuencia, la ecuación T(x) = 0 tiene más 
de una solución. Así, las dos condiciones del teorema son ambas verdaderas o ambas son 
falsas. ■ 
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TEOREMA 1 



i 


La transformación T no es 
sobre IR 3 . 


Sea T : R" —» R'" una transformación lineal y sea A su matriz estándar. 

De esta forma, 

d) T mapea R" sobre R"' si y solo si las columnas de A generan a R"'; 
b ) T es uno a uno si y solo si las columnas de A son linealmente independientes. 

DEMOSTRACIÓN 

a) De acuerdo con el teorema 4 de la sección 1.4, las columnas de A generan a R"' si y solo 
si para cada b en R m la ecuación Ax = b es consistente; en otras palabras, si y solo si para 
cada b, la ecuación T(x) = b tiene al menos una solución. Esto es cierto si y solo si T 
mapea R" sobre R m . 

b) Las ecuaciones T(x) = 0 y Ax = 0 son iguales excepto por la notación. Así, de acuerdo 

con el teorema 11, Tes uno a uno si y solo si Ax = 0 tiene únicamente la solución trivial. 
Esto ocurre si y solo si las columnas de A son linealmente independientes, como ya se 
indicó en el enunciado (3) del recuadro en la sección 1.7. ■ 

El enunciado a) del teorema 12 es equivalente al enunciado “T mapea R" sobre R"' si y 
solo si cada vector en R" ! es una combinación lineal de las columnas de A”. Véase el teorema 
4 de la sección 1.4 

En el siguiente ejemplo y en algunos ejercicios posteriores, los vectores columna están 
escritos en filas, como x = (x¡, ,v 2 ). mientras que T(x) se escribe como T(x\ , x 2 ) en vez de em¬ 
plear la manera más formal T((x¡, x 2 )). 


EJEMPLO 5 Sea T(x \, x 2 ) = (3xi + x 2 , 5xi + 1x2, x\ + 3x 2 ). Demuestre que T es una 
transformación lineal uno a uno. ¿T mapea R 2 sobre R 3 ? 

SOLUCIÓN Cuando x y T(x) se escriben como vectores columna, es posible determinar 
por inspección la matriz estándar de T, visualizando el cálculo fila-vector de cada entrada 
en Ax. 


3xi + x 2 
5xi + 1X2 


" ? ?" 
? ? 

Xi 


"3 

5 

r 

7 

X\ 

x\ + 3x 2 


? ? 

A 

_* 2 _ 


1 

3 

x 2 _ 


Así, T es claramente una transformación lineal; su matriz estándar A se muestra en (4). 
Las columnas de A son linealmente independientes porque no son múltiplos entre sí. De 
acuerdo con el teorema 12 b), T es uno a uno. Para determinar si T es sobre R 3 , examine el 
espacio generado por las columnas de A. Como A es de 3 x 2, las columnas de A generan a 
R 3 si y solo si A tiene 3 posiciones pivote, de acuerdo con el teorema 4. Esto es imposible, 
ya que A solo tiene 2 columnas. Así, las columnas de A no generan a R 3 , y la transformación 
lineal asociada no es sobre R 3 . ■ 


PROBLEMA DE PRÁCTICA 

Sea T : R 2 —» R 2 la transformación que primero efectúa un trasquilado horizontal que 
mapea e 2 en e 2 — .5ei (pero deja inalterado a ei), y después refleja el resultado a través del 
eje x 2 . Suponiendo que T es lineal, encuentre su matriz estándar. [Sugerencia: Determine la 
ubicación final de las imágenes de y e 2 ]. 
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1.9 EJERCICIOS 


En los ejercicios 1 a 10, suponga que T es una transformación lineal. 

Encuentre la matriz estándar de T. 

1. T : IR 2 -> IR 4 , 7Te,) = (3, 1, 3, 1) y T(e 2 ) = (-5, 2, 0, 0), donde 
ei = (l,0)ye 2 = (0, 1). 

2. T:U 3 ^ IR 2 , T(ei) = (1, 4), J(e 2 ) = (-2, 9) y J(e 3 ) = (3, -8), 
donde ei, e 2 y e 3 son las columnas de la matriz identidad de 
3x3. 

3. T : IR 2 -> R 2 es una transformación de trasquilado vertical que 
mapea ei en ei — 3e 2 , pero deja inalterado a e 2 . 

4. 7" : [R 2 —> IR 2 es una transformación de trasquilado horizontal 
que no altera a e¡ y mapea e 2 en e 2 + 2ei. 

5. T : IR 2 —> IR 2 hace girar a los puntos (en torno al origen) a través 
de un ángulo de ir/2 radianes (en sentido antihorario). 

6. T: IR 2 —> IR 2 hace girar a los puntos (en torno al origen) a través 
de un ángulo de —'ítt/2 radianes (en el sentido horario). 

7. T : IR 2 —> IR 2 primero hace girar puntos a través de —3 tt/ 4 ra¬ 
dianes (en el sentido horario) y después los refleja a 
través del eje horizontal x\. [Sugerencia: Considere que 

r(ei) = (-1/V2,1/V2)]. 

8 . T: IR 2 -> IR 2 primero realiza una transformación de trasquilado 
horizontal que transforma a e 2 en e 2 + 2ei (dejando inalterado a 
e¡) y después refleja los puntos a través de la recta x 2 = —x\. 

9. T : IR 2 —> IR 2 primero refleja los puntos a través del eje horizontal 
X\ y luego los hace girar — tt/ 2 radianes. 

10. T : IR 2 —> IR 2 primero refleja los puntos a través del eje horizon¬ 
tal *1 y luego los refleja a través de la recta x 2 = x¡. 

11. Una transformación lineal r: IR 2 —> IR 2 primero refleja los pun¬ 
tos a través del eje x¡ y luego los refleja a través del eje x 2 . 
Demuestre que T también se puede describir como una transfor¬ 
mación lineal que hace girar los puntos en torno al origen. ¿Cuál 
es el ángulo de esa rotación? 

12. Demuestre que la transformación del ejercicio 10 es meramente 
una rotación en torno al origen. ¿Cuál es el ángulo de rotación? 

13. Sea T : IR 2 —» IR 2 la transformación lineal tal que T(e i) y r(e 2 ) 
son los vectores que se muestran en la figura. Con base en la 
figura, dibuje el vector T(2, 1). 


Hej) 


T(e,) 


14. Sea T: IR 2 —» IR 2 una transformación lineal con matriz estándar 
A = [ai a 2 ], donde a¡ y a 2 se muestran en la figura, en la parte 
superior de la columna 2. Utilizando la figura, dibuje la imagen 


de 


bajo la transformación T. 


*2 



• a l 


^.a 2 


En los ejercicios 15 y 16, llene las entradas faltantes de la matriz, 
suponiendo que la ecuación es válida para todos los valores de las 
variables. 

15. 


_ ? 


r ^ 


3xj — 2 x 2 

? 

? 

? 

? 

X\ 

_* 2 _ 

— 

1 

* 

¿í + 

1_ 


? 

? 

? 

Xi 


2 x¡ — 4x 2 

? 

? 

? 

x 2 

= 

Xi — x 3 

? 

? 

? 

x 3 


—x 2 + 3 x 3 


En los ejercicios 17 a 20, demuestre que T es una transformación li¬ 
neal encontrando una matriz que implemente el mapeo. Observe que 
X\, x 2 ,... no son vectores, sino entradas en vectores. 

17. T(x i, X 2 , X3, X 4 ) = (xi + 2x2, o, 2 x 2 + X 4 , X 2 — X4) 

18. T(x\, x 2 ) = (x\ + 4 x 2 , 0, x\ — 3x 2 , xi) 

19. T(x\, x 2 , x 3 ) = (xi — 5x 2 + 4x3, x 2 — 6x3) 

20. T(x 1 , x 2 , X3, X4) = 3xi + 4 x 3 — 2 x 4 (Observe que: T : IR 4 —> IR) 

21. Sea T : IR 2 —> IR 2 una transformación lineal tal que T(x¡, x 2 ) = 
(xi + x 2 , 4xi + 5x 2 ). Encuentre x tal que T(x) = (3, 8 ). 

22. Sea T" : IR 2 — IR 3 una transformación lineal con T(x 1 , x 2 ) = 
(2xi — x 2 , — 3xi + x 2 , 2xi — 3 x 2 ). Encuentre x tal que 
T(x) = (0, -1, -4). 


En los ejercicios 23 y 24, marque cada enunciado como verdadero o 
falso. Justifique sus respuestas. 

23. a) Una transformación lineal T: IR” —> IR" ! está completamente 

determinada por sus efectos sobre las columnas de la matriz 
identidad de n x n. 

b) Si T': IR 2 —>• IR 2 hace girar los vectores un ángulo 1 p en torno 
al origen, entonces T es una transformación lineal. 

c) Cuando dos transformaciones lineales se realizan una tras 
otra, el efecto combinado no siempre es una transformación 
lineal. 

d) Un mapeo T \ W —> IR"' es sobre IR"' si cada vector x en IR" 
se mapea sobre algún vector en IR™. 

e) Si A es una matriz de 3x2, entonces la transformación 
x i-> Ax no puede ser uno a uno. 

24. a) Si A es una matriz de 4 x 3, entonces la transformación 

x 1 —> Ax mapea IR 3 sobre IR 4 . 
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b ) Cada transformación lineal de IR" a IR'" es una transforma¬ 
ción matricial. 


c) Las columnas de la matriz estándar para una transformación 
lineal de IR" a IR™ son las imágenes de las columnas de la 
matriz identidad de n x n bajo T. 

d) Un mapeo T : IR" —» IR"' es uno a uno si cada vector en IR" 
se mapea sobre un único vector en IR'". 

e) La matriz estándar de una transformación de trasquilado 


horizontal de IR 2 a IR 2 tiene la forma 


, donde ay b 


son ± 1. 


En los ejercicios 25 a 28, determine si la transformación lineal espe¬ 
cificada es a) uno a uno o b) sobre. Justifique cada respuesta. 

25. La transformación en el ejercicio 17. 

26. La transformación en el ejercicio 2. 

27. La transformación en el ejercicio 19. 

28. La transformación en el ejercicio 14. 

En los ejercicios 29 y 30, describa las posibles formas escalonadas 

de la matriz estándar para una transformación lineal T. Utilice la no¬ 
tación del ejemplo 1 de la sección 1.2 

29. T : IR 3 — > IR 4 es uno a uno. 30. T : IR 4 —> IR 3 es sobre. 

31. Sea T : IR" — > IR™ una transformación lineal, y sea A su matriz 

estándar. Complete el siguiente enunciado para hacerlo verda¬ 
dero: “T es uno a uno si y solo si A tiene_columnas pivo¬ 

te”. Explique por qué el enunciado es verdadero. [Sugerencia: 
Consulte los ejercicios de la sección 1.7]. 

32. Sea T : IR" —» IR"’ una transformación lineal, y sea A su matriz 

estándar. Complete el siguiente enunciado para hacerlo verda¬ 
dero: “T mapea IR" sobre IR™ si y solo si A tiene_co¬ 

lumnas pivote”. Encuentre algunos teoremas que expliquen por 
qué el enunciado es verdadero. 


33. Verifique la unicidad de A en el teorema 10. Sea T : IR" — > IR"' 
una transformación lineal tal que T(x) = Bx para alguna matriz 
B de m x n. Demuestre que si A es la matriz estándar de T, 
entonces A = B. [Sugerencia: Demuestre que Ay B tienen las 
mismas columnas], 

34. Sean S : R p —» IR" y T : IR" —> IR'" transformaciones lineales. 
Demuestre que el mapeo x T(S(x)) es una transformación 
lineal (de IR / ' a IR m ). [Sugerencia: Calcule T(S(cu + dx)) para 
u, v en R p y escalares c y d. Justifique cada paso del cálculo, 
y explique por qué este proceso conduce a la conclusión 
deseada]. 

35. Si una transformación lineal T : IR" —> IR'" mapea R" sobre 
R m , ¿es posible encontrar una relación entre m y n? Si T es uno 
a uno, ¿qué se puede decir acerca de m y ni 

36. ¿Por qué la pregunta "¿La transformación lineal T es sobre?” 
es una pregunta de existencia? 

[M] En los ejercicios 37 a 40, sea T la transformación lineal cuya 
matriz estándar se presenta. En los ejercicios 37 y 38, determine si 
T es un mapeo uno a uno. En los ejercicios 39 y 40, determine si T 
mapea R 5 sobre R 5 . Justifique sus respuestas. 
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-8 
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-7 
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40. 

-8 

-6 
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-5 

-6 

—4 

9 

8 


13 

14 

15 

3 
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SOLUCIÓN AL PROBLEMA DE PRÁCTICA 



Observe lo que ocurre a ei y e 2 - Véase la figura 5. Primero, ei no sufre alteraciones por el 
trasquilado y después se refleja en —ei. Así, T( ei) = —ei. Segundo, e 2 va a e? - .5ei por 



FIGURA 5 Composición de dos transformaciones. 
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la transformación de trasquilado. Como la reflexión a través del eje xj cambia a ei en —ei 
y deja inalterado a e 2 , el vector e 2 — .5ei va a e 2 + .5ei. Así, C(e 2 ) = e 2 + .5ei. Por lo tanto, 
la matriz estándar de T es 

[HeO T(e 2 ) ] = [—e, e 2 + .5e, ] = 


-1 .5 

0 1 


1.10 


MODELOS LINEALES EN LOS NEGOCIOS, CIENCIA E INGENIERÍA 


En esta sección todos los modelos matemáticos son lineales', es decir, cada uno de ellos des¬ 
cribe un problema mediante una ecuación lineal, por lo general en forma vectorial o matricial. 
El primer modelo concierne al campo de la nutrición, pero en realidad es representativo de 
una técnica general en problemas de programación lineal. El segundo modelo pertenece al 
campo de la ingeniería eléctrica. El tercer modelo introduce el concepto de una ecuación 
lineal en diferencias, una poderosa herramienta matemática para estudiar procesos dinámicos 
en una amplia variedad de campos, como ingeniería, ecología, economía, telecomunicacio¬ 
nes y ciencias administrativas. Los modelos lineales son importantes porque los fenómenos 
naturales con frecuencia son lineales o casi lineales cuando las variables implicadas se man¬ 
tienen dentro de límites razonables. Además, los modelos lineales se adaptan más fácilmente 
al cálculo computacional que los complejos modelos no lineales. 

Conforme estudie cada modelo, preste atención en cómo su linealidad refleja alguna 
propiedad del sistema que se modela. 


Elaboración de una dieta nutritiva para bajar de peso 

La fórmula para la dieta Cambridge, una conocida dieta de la década de 1980, se basó en años 
de investigación. Un equipo de científicos, encabezados por el doctor Alan H. Howard, desa¬ 
rrollaron esta dieta en la Universidad de Cambridge después de más de ocho años de trabajo 
clínico con pacientes obesos. 1 La fórmula de la dieta baja en calorías combina un balance 
preciso de carbohidratos, proteínas de alta calidad y grasa, junto con vitaminas, minerales, 
oligoelementos y electrolitos. Millones de personas han seguido la dieta para lograr una rápi¬ 
da y sustancial pérdida de peso. 

Para alcanzar las cantidades y proporciones deseadas de nutrientes, Howard tuvo que 
incorporar una gran variedad de alimentos en la dieta. Cada alimento suministraba varios 
de los ingredientes requeridos, pero no en las proporciones correctas. Por ejemplo, la le¬ 
che sin grasa (descremada) fue la principal fuente de proteína, pero contenía mucho calcio. 
De manera que se utilizó harina de soya para aportar proteína porque contiene poco cal¬ 
cio. Sin embargo, proporcionalmente la harina de soya contiene mucha grasa, así que se 
adicionó suero de leche porque contiene menos grasa en relación con el calcio. Por desgracia, 
el suero de leche contiene muchos carbohidratos... 

El siguiente ejemplo ilustra el problema a pequeña escala. En la tabla 1 se listan tres 
de los ingredientes en la dieta, junto con las cantidades de ciertos nutrientes aportados por 
100 gramos (g) de cada ingrediente. 2 

EJEMPLO 1 Si es posible, encuentre alguna combinación de leche descremada, harina 
de soya y suero de leche que aporte las cantidades exactas de proteínas, grasas y carbohidratos 
suministrados por la dieta diaria (tabla 1). 


1 El primer anuncio de este rápido régimen para bajar de peso se publicó en el International Journal of Obesity 
(1978) 2,321-332. 

2 Ingredientes en la dieta desde 1984; datos de nutrientes en ingredientes adaptados del IJSDA Agricultural 
Handbooks, núms. 8-1 y 8-6, 1976. 
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TABLA 1 


Cantidades (en g) suministradas por 100 g de ingrediente 

Cantidades (en g) 
suministradas por la dieta 
Cambridge en un día 

Nutriente 

Leche 

descremada 

Harina 
de soya 

Suero 
de leche 

Proteínas 

36 

51 

13 

33 

Carbohidratos 

52 

34 

74 

45 

Grasa 

0 

7 

1.1 

3 


SOLUCIÓN Dejemos que x\, X 2 y x¡, respectivamente, denoten el número de unidades (100 
g) de esos alimentos. Un enfoque al problema consiste en deducir ecuaciones por separado 
para cada nutriente. Por ejemplo, el producto 

[ X\ unidades de 1 íproteínas por unidad 
[leche descremadaj [de leche descremada 

da la cantidad de proteína suministrada por x\ unidades de leche descremada. A esta cantidad, 
le agregaríamos productos similares de harina de soya y suero de leche, igualando la suma 
resultante con la cantidad de proteína que se requiere. Se tendrían que realizar cálculos simi¬ 
lares para cada nutriente. 

Un método más eficiente, y más sencillo conceptualmente, consiste en considerar un 
“vector nutriente” para cada alimento y elaborar solo una ecuación vectorial. La cantidad de 
nutrientes aportados por x\ unidades de leche descremada es el múltiplo escalar 

Escalar Vector 

x¡ unidades de 1 [nutrientes por unidad 1 __ 
leche descremadaj [de leche descremada J X,a| ( 1 ) 

donde ai es la primera columna de la tabla 1. Sean aj y a 3 los vectores correspondientes para 
harina de soya y suero de leche, respectivamente, y sea b el vector que lista el total de nutrien¬ 
tes requerido (la última columna de la tabla). Luego, *282 y A'.iai dan los nutrientes suminis¬ 
trados por X 2 unidades de harina de soya y X 3 unidades de suero de leche, respectivamente. 
De esta forma, la ecuación relevante es 

X\Si + X2&2 + *3 a 3 — b (2) 

La reducción por filas de la matriz aumentada del sistema de ecuaciones correspondiente 
indica que 


"36 

51 

13 

33 


" 1 

0 

0 

.277" 

52 

34 

74 

45 

~ ••• ~ 

0 

1 

0 

.392 

0 

7 

1.1 

3 


0 

0 

1 

.233 


A tres dígitos significativos, la dieta requiere .277 unidades de leche descremada, .392 uni¬ 
dades de harina de soya y .233 unidades de suero de leche, con el objetivo de aportar las 
cantidades deseadas de proteínas, carbohidratos y grasa. ■ 

Es importante que los valores encontrados para xi, X 2 y x-¡ no sean negativos. Esto es 
necesario para que la solución sea físicamente realizable. (Por ejemplo, ¿cómo se podrían 
emplear — .233 unidades de suero de leche?) Para un gran número de requerimientos nutri- 
cionales, será necesario utilizar un mayor número de alimentos para así generar un sistema 
de ecuaciones con una solución “no negativa”. Por consiguiente, se necesitaría examinar 
muchísimas combinaciones diferentes de alimentos para encontrar un sistema de ecuaciones 
con tal solución. De hecho, el diseñador de la dieta Cambridge fue capaz de proporcionar 31 
nutrientes en cantidades precisas empleando solo 33 ingredientes. 

El problema de la elaboración de la dieta conduce al sistema lineal (2) porque la cantidad 
de nutrientes aportada por cada alimento se puede escribir como un múltiplo escalar de un vec¬ 
tor, como en (1). Es decir, los nutrientes suministrados por un alimento son proporcionales a la 
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cantidad del alimento agregado a la mezcla de la dieta. Además, cada nutriente en la mezcla es 
la suma de las cantidades de los diversos alimentos. 

Los problemas de formulación de dietas especializadas para humanos y ganado ocurren 
con frecuencia. Por lo regular, dichos problemas se tratan mediante técnicas de programación 
lineal. Nuestro método de construir ecuaciones vectoriales a menudo simplifica la tarea de 
formular tales problemas. 

Ecuaciones lineales y redes eléctricas 

El flujo de corriente en una red eléctrica sencilla se puede describir por un sistema de ecua¬ 
ciones lineales. Una fuente de voltaje, como una batería, genera una corriente de electrones 
que fluye a través de la red. Cuando la corriente pasa por un resistor (ya sea una bombilla o un 
motor), parte del voltaje se “consume”; de acuerdo con la ley de Ohm, esta “caída de voltaje” 
en el resistor está dada por 

V= RI 

donde el voltaje V se mide en volts , la resistencia R en ohms (denotados con el símbolo í i), 
y el flujo de corriente / en amperes (A). 

La red de la figura 1 contiene tres circuitos cerrados. Las corrientes que fluyen en los 
circuitos 1, 2 y 3 se denotan con I\, I 2 e I 3 , respectivamente. Las direcciones asignadas a 
las corrientes de circuito son arbitrarias. Si una corriente resulta negativa, entonces la di¬ 
rección real del flujo de corriente es opuesta a la que se indica en la figura. Si la dirección 
de corriente que se muestra se aleja del lado positivo de una batería (jh), alrededor del lado 
negativo, entonces el voltaje es positivo; de otra forma, el voltaje es negativo. 

El flujo de corriente en un circuito está regido por la siguiente ley. 


LEY DE KIRCHHOFF SOBRE EL VOLTAJE 

La suma algebraica de las caídas de voltaje RI en una dirección alrededor de un circuito 
es igual a la suma algebraica de las fuentes de voltaje en la misma dirección alrededor 
del circuito. 



FIGURA 1 


EJEMPLO 2 Determine las corrientes de circuito en la red de la figura 1. 

SOLUCION Para el circuito 1 la corriente I¡ fluye a través de tres resistores, y la suma de 
las caídas de voltaje RI es 

4/i + 4/i + 3/1 = (4 + 4 + 3)/| = llA 

La corriente en el circuito 2 también fluye en parte del circuito 1, por la pequeña rama entre 
Ay B. Ahí la caída RI asociada es 3/2 volts. Sin embargo, la dirección de corriente para la 
rama AB en el circuito 1 es opuesta a la elegida para el flujo en el circuito 2, de manera que 
la suma algebraica de todas las caídas RI para el circuito 1 es 11 /1 — 3 / 2 . Como el voltaje en 
el circuito 1 es +30 volts, la ley de voltaje de Kirchhoff implica que 

11/! - 3/ 2 = 30 

La ecuación para el circuito 2 es 

-3/i + 6/ 2 - h = 5 

El término — 3/¡ viene del flujo de la corriente del circuito 1 por la rama AB (con una caí¬ 
da de voltaje negativa porque ahí el flujo de corriente es opuesto al flujo en el circuito 2 ). 
El término 6/2 es la suma de todas las resistencias en el circuito 2, multiplicada por la corrien¬ 
te del circuito. El término —1^ = — 1 • I 3 proviene de la corriente del circuito 3 que fluye por 
el resistor de 1 ohm en la rama CD , en la dirección opuesta al flujo en el circuito 2. La ecua¬ 
ción para el circuito 3 es 


-I 2 + 3/3 = -25 
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Observe que la batería de 5 volts en la rama CD se cuenta como parte de los circuitos 2 y 3, 
pero se considera de —5 volts para el circuito 3 debido a la dirección elegida para la corriente 
en el circuito 3. La batería de 20 volts es negativa por la misma razón. 

Las corrientes de circuito se encuentran resolviendo el sistema 

ll/i - 3/ 2 = 30 

—3/i + 6/2 — I3 = 5 (3) 

- / 2 + 3/3 = —25 

Las operaciones de fila sobre la matriz aumentada conducen a la solución: I\ = 3 A, 
I 2 = 1 A e 73 = — 8 A. El valor negativo de 73 indica que la corriente real en el circuito 3 
fluye en la dirección opuesta a la que se muestra en la figura 1. ■ 

Es conveniente observar el sistema (3) como una ecuación vectorial: 


h 

" 11" 

-3 

+ h 

1 

en ^0 

1 

l_ 

+ h 

o - 

-1 

_ 

30" 

5 


0 


L-i 


3 


-25 


t t t t 

rj r 2 r 3 v 


La primera entrada de cada vector concierne al primer circuito, y de manera similar para la 
segunda y tercera entradas. El primer vector resistor ri lista la resistencia en los diversos 
circuitos por donde fluye la corriente í\. Una resistencia se registra como negativa cuando l\ 
fluye contra la dirección de flujo en otro circuito. Examine la figura 1 y vea cómo calcular 
las entradas en ri; luego, haga lo mismo con r 2 y m. La forma matricial de la ecuación (4), 


Ri = v, donde, R = [ ri r 2 r3 ] e 


/, 

h 

h 


da una versión matricial de la ley de Ohm. Si todas las corrientes de circuito se seleccionan 
en la misma dirección (por ejemplo, en sentido antihorario), entonces todas las entradas fuera 
de la diagonal principal de R serán negativas. 

De una mirada, la ecuación matricial Ri = y permite distinguir fácilmente la linealidad 
de este modelo. Por ejemplo, si se duplica el vector voltaje, entonces lo mismo ocurre con el 
vector corriente. Además, es válido el principio de superposición. Es decir, la solución de la 
ecuación (4) es la suma de las soluciones de las ecuaciones 


Ri = 

1 

O O 
en 

l_ 

Ri = 

"0 

5 

y Ri = 

0" 

0 


0 


0 


-25 


Cada ecuación aquí corresponde al circuito con una sola fuente de voltaje (las otras fuentes 
se remplazan con los alambres que cierran cada circuito). El modelo para el flujo de co¬ 
rriente es lineal porque precisamente las leyes de Ohm y de Kirchhoff son lineales. La caída 
de voltaje en un resistor es proporcional a la corriente que fluye por él (Ohm), y la suma de 
las caídas de voltaje en un circuito iguala a la suma de las fuentes de voltaje en el circuito 
(Kirchhoff). 

Las corrientes de circuito en una red se pueden emplear para determinar la corriente 
en cualquier rama de la red. Si solo una corriente de circuito pasa por una rama, como de B 
a D en la figura 1, la corriente de la rama es igual a la corriente de circuito. Si más de una 
corriente de circuito pasan por una rama, como de A a B, la corriente de rama es la suma 
algebraica de las corrientes de circuito en la rama ( ley de Kirchhoff sobre la corriente). Por 
ejemplo, la corriente en la rama AB es 7¡ — 7 2 = 3 — 1 = 2 A, en la dirección de 7¡. La corrien¬ 
te en la rama CD es L — h = 9 A. 
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Ecuaciones en diferencias 

En muchos campos, como ecología, economía e ingeniería, surge la necesidad de modelar 
matemáticamente un sistema dinámico que cambia en el tiempo. Diversos aspectos del siste¬ 
ma se miden en intervalos de tiempo discretos, produciendo así una secuencia de vectores xo, 
Xi, X2,... Las entradas en x¿ brindan información sobre el estado del sistema en el momento 
de la Pésima medición. 

Si existe una matriz A tal que xi = Axo, X 2 = Axi y, en general, 

x¿+i = Axk para k = 0, 1, 2,... (5) 

entonces (5) se llama ecuación lineal en diferencias (o relación de recurrencia). Con esta 
ecuación, se pueden calcular xi, X 2 , y así sucesivamente, si xo se conoce. Las secciones 4.8 
y 4.9, así como algunas otras del capítulo 5, desarrollarán fórmulas para x¿ y describirán 
qué ocurre a x¿ conforme k se incrementa indefinidamente. El análisis que se presenta a con¬ 
tinuación ilustra cómo puede originarse una ecuación en diferencias. 

Un tema de interés para los demógrafos es el movimiento de poblaciones o grupos de 
gente de una región a otra. El modelo sencillo que se incluye aquí considera los cambios en la 
población de una cierta ciudad y sus suburbios durante un periodo de años. 

Fije un año inicial —por ejemplo, 2000— y denote las poblaciones de la ciudad y los 
suburbios de ese año mediante rg y .vo, respectivamente. Sea xq el vector de población 


xo 


rg Población de la ciudad, 2000 

So Población suburbana, 2000 


Para 2001 y los años subsiguientes, denote las poblaciones de la ciudad y de los suburbios 
mediante los vectores 


xi = 


«i 



X3 = 


n 

■U 


Nuestro objetivo es describir matemáticamente cómo podrían estar relacionados esos vecto¬ 
res. 

Suponga que estudios demográficos revelan que, cada año, cerca del 5% de la población 
de la ciudad se muda a los suburbios (lo que significa que el 95% permanece en la ciudad), 
mientras que el 3% de la población suburbana cambia su residencia a la ciudad (en tanto que 
el 97% permanece en los suburbios). Véase la figura 2. 



FIGURA 2 Porcentaje anual de migración entre la ciudad y los suburbios. 


Después de un año, los habitantes originales de la ciudad, rg, están ahora distribuidos 
entre la ciudad y los suburbios como 


• 95r 0 
.05r 0 



Permanecen en la ciudad 
Se mudan a los suburbios 


( 6 ) 


Los habitantes de los suburbios en 2000, Sg, están distribuidos un año después como 


So 


.03 

.97 


Se mudan a la ciudad 
Permanecen en los suburbios 


(7) 
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Los vectores en (6) y (7) explican cómo se distribuye la población en 2001. 3 Así, 


r\ 


r.95i 


r.03i 


'.95 

.03' 

r o 

_ 

= r 0 

o 

LO 

+ so 

vo 


.05 

.97 

_S 0 _ 


Es decir, 


xi = Mx o (8) 

donde M es la matriz de migración determinada por la siguiente tabla: 

De: 

Ciudad Suburbios A: 

'.95 .03] Ciudad 

.05 .97 Suburbios 

La ecuación (8) describe cómo cambió la población de 2000 a 2001. Si los porcentajes de 
migración permanecen constantes, entonces el cambio de 2001 a 2002 está dado por 

x 2 = Mx i 

y, de manera similar, de 2002 a 2003 y en los años subsiguientes. En general, 

xj¿ + i = Mxk para k = 0, 1,2,... (9) 

La secuencia de vectores {xo, X|, x 2 ,...} describe las poblaciones de la ciudad y los suburbios 
durante un periodo de años. 


EJEMPLO 3 Calcule la población de la región que se acaba de describir para los años 
2001 y 2002, considerando que la población en el año 2000 era de 600,000 habitantes en la 
ciudad y de 400,000 en los suburbios. 


SOLUCIÓN La población inicial en 2000 es xq = 


600,000 

400,000 


Para 2001, 



.95 

.03 

600,000 


582,000 

Xj = 

.05 

.97 

400,000 


418,000 


Para 2002, 


'.95 

.03' 

'582,000' 


'565,440' 

.05 

.97 

418,000 


434,560 


El modelo para el movimiento poblacional en (9) es lineal porque la correspondencia 
X£ i-> x ¿-1 i es una transformación lineal. La linealidad depende de dos hechos: el número de 
personas que eligen cambiar su residencia de una área a otra es proporcional al número 
de personas en esa área, como se muestra en (6) y (7), y el efecto acumulativo de esas elec¬ 
ciones se encuentra sumando el movimiento de las personas de las diferentes áreas. 


PROBLEMA DE PRÁCTICA 

Encuentre una matriz A y vectores x y b tales que el problema del ejemplo 1 signifique resol¬ 
ver la ecuación Ax = b. 


3 Para simplificar, se ignoran otros factores que influyen en la población, como nacimientos, muertes y movimientos 
migratorios hacia la región que comprende la ciudad y los suburbios, así como hacia fuera de ella. 
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1.10 EJERCICIOS 

1. Por lo regular, el empaque de un cereal indica el número de 
calorías y las cantidades de proteínas, carbohidratos y grasa 
contenidas en una porción del producto. A continuación se dan 
las cantidades para dos cereales comunes. Suponga que se pre¬ 
parará una mezcla de esos dos cereales, de manera que contenga 
exactamente 295 calorías, 9 g de proteínas, 48 g de carbohidra¬ 
tos y 8 g de grasa. 

a) Establezca una ecuación vectorial para este problema. In¬ 
cluya un enunciado que explique el significado de cada va¬ 
riable empleada en la ecuación. 

b) Escriba una ecuación matricial equivalente, y determine si es 
posible preparar la mezcla deseada de los dos cereales. 


Información nutricional por cada porción 


Nutriente 

General Mills 
Cheerios® 

Quaker® 100% 
Natural Cereal 

Calorías 

110 

130 

Proteínas (g) 

4 

3 

Carbohidratos (g) 

20 

18 

Grasa (g) 

2 

5 


2. Una porción de Shredded Wheat aporta 160 calorías, 5 g de pro¬ 
teína, 6 g de fibra y 1 g de grasa. Una porción de Crispix® aporta 
110 calorías, 2 g de proteína, .1 g de fibra y .4 g de grasa. 

a) Establezca una matriz B y un vector u tal que Su dé las can¬ 
tidades de calorías, proteínas, fibra y grasa contenidas en una 
mezcla de tres porciones de Shredded Wheat y dos porciones 
de Crispix. 

b) [M] Suponga que se desea un cereal con más fibra que 
Crispix, pero con menos calorías que Shredded Wheat. 
¿Es posible que una mezcla de ambos cereales proporcione 
130 calorías, 3.20 g de proteína, 2.46 g de fibra y .64 g de 
grasa? Si es posible, ¿cuál es la mezcla? 

3. Después de tomar una clase sobre nutrición, una consumidora 
asidua de los productos de Annie’s®, a quien le gusta el producto 
Mac and Cheese (macarrones con queso), decide mejorar los ni¬ 
veles de proteína y fibra en su almuerzo favorito agregando bró- 
coli y pollo enlatado. La información nutricional de los alimentos 
mencionados en este ejercicio se indica en la siguiente tabla. 


Mac and Cheese a Annie's Whole Wheat Shells and White 
Cheddar (pasta integral y queso cheddar). ¿Qué proporcio¬ 
nes de cada alimento debería emplear para lograr los mismos 
objetivos que en el inciso a)? 

4. La dieta Cambridge aporta .8 g de calcio por día, además de los 
nutrientes listados en la tabla 1 del ejemplo 1. Las cantidades de 
calcio por unidad (100 g) que aportan los tres ingredientes en la 
dieta Cambridge son las siguientes: 1.26 g de leche descremada, 
. 19 g de harina de soya y .8 g de suero de leche. Otro ingrediente 
en la mezcla de la dieta es proteína aislada de soya, que aporta 
los siguientes nutrientes en cada unidad: 80 g de proteínas, 0 g 
de carbohidratos, 3.4 g de grasa y .18 g de calcio. 

a) Establezca una ecuación matricial cuya solución determine 
las cantidades de leche descremada, harina de soya, suero de 
leche y proteína aislada de soya necesarias para suministrar 
las cantidades precisas de proteínas, carbohidratos, grasa y 
calcio en la dieta Cambridge. Indique qué representan las 
variables de la ecuación. 

b) [M] Resuelva la ecuación en a) y analice la respuesta. 

En los ejercicios 5 a 8, escriba una ecuación matricial que determine 
las corrientes del circuito. [M] Si dispone de MATLAB o de algún 
otro programa de matrices, resuelva el sistema para las corrientes del 
circuito. 



Información nutricional por cada porción 


Nutriente 

Mac and Cheese 

Brócoli 

Pollo 

Shells 

Calorías 

270 

51 

70 

260 

Proteína (g) 

10 

5.4 

15 

9 

Fibra (g) 

2 

5.2 

0 

5 


a) [M] Si ella quiere limitar su almuerzo a 400 calorías, pero 
desea obtener 30 g de proteína y 10 g de fibra, ¿qué propor¬ 
ciones de Mac and Cheese, brócoli y pollo debería utilizar? 

b) [M] Ella encontró que no había mucho brócoli en las pro¬ 
porciones del inciso a), así que decidió cambiar del clásico 
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50V 40V 



30V 20V 


9. En cierta región, cada año. cerca del 7% de la población de una 
ciudad se muda a los suburbios, y alrededor del 5% de la po¬ 
blación suburbana cambia su residencia a la ciudad. En 2010, 
había 800,000 residentes en la ciudad y 500,000 en los subur¬ 
bios. Establezca una ecuación en diferencias que describa esta 
situación, donde xo sea la población inicial en 2010. Luego, es¬ 
time las poblaciones en la ciudad y en los suburbios dos años 
después, es decir, en 2012. (Ignore otros factores que podrían 
influir en el tamaño de las poblaciones). 

10. Cada año, en cierta región, cerca del 6% de la población de una 
ciudad se muda a los suburbios, y alrededor del 4% de la pobla¬ 
ción suburbana se muda a la ciudad. En 2010, había 10,000,000 
de residentes en la ciudad y 800,000 en los suburbios. Esta¬ 
blezca una ecuación en diferencias que describa esta situación, 
donde xo sea la población inicial en 2010. Luego, estime las 
poblaciones en la ciudad y en los suburbios dos años después, 
es decir, en 2012. 

11. En 1994, la población de California era de 31,524,000 habitan¬ 
tes, y la población que vivía en Estados Unidos, pero fuera de 
California, era de 228,680,000 habitantes. Durante el año, se 
estimó que 516,100 personas se mudaron de California a otro 
lugar en Estados Unidos, mientras que 381,262 personas se mu¬ 
daron a California desde diversos lugares del país. 4 

a) Establezca la matriz de migración para esta situación, utili¬ 
zando cinco lugares decimales para las tasas de migración 
entrante y saliente de California. Explique cómo obtuvo la 
matriz de migración. 

tí) [M] Calcule las poblaciones proyectadas para el año 2000 en 
California y en otras partes de Estados Unidos, suponiendo 
que las tasas de migración no cambian durante el periodo 
de 6 años. (Esos cálculos no toman en cuenta nacimientos, 
muertes o la migración sustancial de personas a California 
y a otros lugares de Estados Unidos provenientes de otros 
países). 


4 Datos de migración suministrados por la Unidad de Investigación Demográ¬ 
fica del Departamento de Finanzas del estado de California. 


12. [M] Budget® Rent A Car en Wichita, Kansas, tiene una flotilla 
de 500 vehículos, distribuidos en tres sucursales. Un auto ren¬ 
tado en una sucursal puede devolverse en cualquiera de las tres. 
Las diversas fracciones de autos devueltos a las tres sucursales 
se muestran en la matriz que aparece a continuación. Suponga 
que un lunes hay 295 autos en el aeropuerto (o que se rentan 
ahí), 55 autos en la sucursal de la zona este, y 150 automóviles 
en el establecimiento de la zona oeste. ¿Cuál será la distribución 
aproximada de autos para el miércoles? 

Autos rentados en: 

Aeropuerto Este Oeste Devueltos en: 

.97 .05 .10 Aeropuerto 

.00 .90 .05 Este 

.03 .05 .85_ Oeste 

13. [M] Sean M y xo como en el ejemplo 3. 

a) Calcule los vectores poblacionales x¿ para k = 1,..., 20. 
Analice sus hallazgos. 

b) Repita el inciso a) considerando una población inicial de 
350.000 en la ciudad y 650,000 en los suburbios. ¿Qué 
encontró? 

14. [M] Estudie cómo los cambios en las temperaturas de los bordes 
de una placa de acero afectan a las temperaturas en los puntos 
interiores de la placa. 

a) Comience por estimar las temperaturas 7j, 73, Tj, T 4 en cada 
uno de los conjuntos de cuatro puntos de la placa que se 
señalan en la figura. En cada caso, el valor de 7* se aproxi¬ 
ma mediante el promedio de las temperaturas en los cuatro 
puntos más cercanos. Consulte los ejercicios 33 y 34 de 
la sección 1.1, donde los valores (en grados) son (20, 27.5, 
30, 22.5). ¿Cómo se relaciona esta lista de valores con 
los resultados obtenidos para los puntos en los conjuntos 
a) y b)l 

b) Sin efectuar cálculos, ¿qué ocurre con las temperaturas in¬ 
teriores en a) cuando todas las temperaturas en los bordes 
se multiplican por 3? Compruebe su suposición. 

c ) Finalmente, haga una conjetura general sobre la correspon¬ 
dencia de la lista de ocho temperaturas en los bordes con la 
lista de las cuatro temperaturas interiores. 


Placa A Placa B 

20° 20° 0 o 0 o 



20 ° 20 ° 10 ° 10 ° 
a) b ) 
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SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


"36 

51 

13 


Xl 


"33" 

52 

34 

74 

, X = 

X2 

, b = 

45 

0 

7 

1.1 


_*3_ 
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EJERCICIOS COMPLEMENTARIOS 


CAPÍTULO 1 

1. Marque cada enunciado como verdadero o falso. Justifique sus 
respuestas. (Si el enunciado es válido, cite hechos o teoremas 
pertinentes. Si es falso, explique por qué o dé un contraejem¬ 
plo que muestre por qué el enunciado no es verdadero en cada 
caso). 

a) Cada matriz es equivalente por filas a una única matriz en 
forma escalonada. 

b) Cualquier sistema de n ecuaciones lineales con n variables 
tiene a lo sumo n soluciones. 

c) Si un sistema de ecuaciones lineales tiene dos soluciones di¬ 
ferentes, debe tener un número infinito de soluciones. 

d) Si un sistema de ecuaciones lineales no tiene variables li¬ 
bres, entonces tiene una solución única. 

e) Si una matriz aumentada [A b] se transforma en [C d] 
mediante operaciones elementales de fila, entonces las ecua¬ 
ciones Ax = b y Cx = d tienen exactamente los mismos 
conjuntos solución. 

/) Si un sistema Ax = b tiene más de una solución, entonces lo 
mismo sucede con el sistema Ax = 0. 

g) Si A es una matriz de m x n y la ecuación Ax = b es con¬ 
sistente para alguna b, entonces las columnas de A generan 
a IR"'. 

h) Si una matriz aumentada [A b] se puede transformar en 
una forma escalonada mediante operaciones elementales de 
fila, entonces la ecuación Ax = b es consistente. 

í) Si las matrices A y B son equivalentes por filas, tienen la 
misma forma escalonada reducida. 

j) La ecuación Ax = 0 tiene la solución trivial si y solo si no 
hay variables libres. 

k) Si A es una matriz de m x n y la ecuación Ax = b es con¬ 
sistente para cada b en IR™, entonces A tiene m columnas 
pivote. 

l) Si una matriz A de m x n tiene una posición pivote en cada 
fila, entonces la ecuación Ax = b tiene una solución única 
para cada b en IR"'. 

m) Si una matriz A de n x n tiene n posiciones pivote, enton¬ 
ces la forma escalonada reducida de A es la matriz identidad 
de n x n. 

n) Si A y B son matrices de 3 x 3 con tres posiciones pivote 
cada una, entonces A se puede transformar en B mediante 
operaciones elementales de fila. 


o) Si A es una matriz de m x n , si la ecuación Ax = b tiene al 
menos dos soluciones diferentes, y si la ecuación Ax = c 
es consistente, entonces la ecuación Ax = c tiene muchas 
soluciones. 

p) Si A y 6 son matrices de m x n equivalentes por filas y si las 
columnas de A generan a IR'", entonces también lo hacen 
las columnas de B. 

q) Si ninguno de los vectores en el conjunto S = {vi, V 2 , V 3 } 
en IR 3 es un múltiplo de los otros vectores, entonces S es 
linealmente independiente. 

r) Si ¡u, v, w} es linealmente independiente, entonces u, v y w 
no están en IR 2 . 

s) En algunos casos, es posible que cuatro vectores generen 
a IR 5 . 

0 Si u y v están en IR"', entonces — u está en Gen {u, v}. 

u) Si u, v y w son vectores diferentes de cero en IR 2 , entonces w 
es una combinación lineal de u y v. 

v) Si w es una combinación lineal de u y v en IR", entonces u 
es una combinación lineal de v y w. 

w) Supongamos que vi, V 2 y V 3 están en IR 5 , V 2 no es múltiplo 
de vi, y V 3 no es una combinación lineal de vi y V 2 . Por lo 
tanto, {vi, V 2 , V 3 } es linealmente independiente. 

x ) Una transformación lineal es una función. 

y) Si A es una matriz de 6 x 5, la transformación lineal x 1 -» Ax 
no puede mapear IR 5 sobre IR 6 . 

z ) Si A es una matriz de m x n con m columnas pivote, en¬ 
tonces la transformación lineal x 1 -» Ax es un mapeo uno 
a uno. 

2. Sean ay b números reales. Describa los posibles conjuntos so¬ 
lución de la ecuación (lineal) ax = b. [Sugerencia: El número 
de soluciones depende de a y b\. 

3. Las soluciones (x, y, z) de una sola ecuación lineal 
ax + by + cz — d 

forman un plano en IR 3 cuando a, b y c no son todos cero. Cons¬ 
truya conjuntos de tres ecuaciones lineales cuyas gráficas a) se 
intersecan en una sola recta, b ) se intersecan en un solo punto, y 
c) no tienen puntos en común. Las siguientes figuras muestran 
gráficas características. 
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Tres planos se intersecan 
en una recta 

a) 



Tres planos sin 
intersección 

c) 



Tres planos se intersecan 
en un punto 

b) 



Tres planos sin 
intersección 

c') 


4. Suponga que la matriz coeficiente de un sistema lineal de 
tres ecuaciones con tres variables tiene una posición pivote en 
cada columna. Explique por qué el sistema tiene una solución 
única. 

5. Determine h y k tales que el conjunto solución del sistema: 
i. es un conjunto vacío, ii. contiene una solución única, y 
iii. contiene un número infinito de soluciones. 

a) Xi + 3x 2 = k b) —2x\ + hx 2 = 1 

4xi + hx 2 = 8 6 xi + kx 2 = —2 

6 . Considere el problema de determinar si el siguiente sistema de 
ecuaciones es consistente: 


c) Defina una transformación lineal T adecuada utilizando la 
matriz en b ), y replantee el problema en términos de T. 


8 . Describa las posibles formas escalonadas de la matriz A. Use la 
notación del ejemplo 1 de la sección 1 . 2 . 

a) A es una matriz de 2 x 3 cuyas columnas generan a IR 2 . 

b) A es una matriz de 3 x 3 cuyas columnas generan a IR 3 . 


9. Escriba el vector 


5 

6 


como la suma de dos vectores, uno sobre 


la recta {(x, y): y = 2 x} y el otro sobre la recta {(x, y): 
y = x /2 j. 


10. Sean ai, a 2 y b los vectores en IR 2 que se muestran en la figura, 
y sea A = [ai a 2 |. ¿Tiene solución la ecuación Ax = b? Si es 
así, ¿es única la solución? Explique su respuesta. 


x 


2 


a l 



X 


1 


11. Construya una matriz A de 2 x 3, que no esté en forma escalona¬ 
da. de manera que la solución de Ax = 0 sea una recta en IR 3 . 

12. Construya una matriz A de 2 x 3. que no esté en forma escalo¬ 
nada, de manera que la solución de Ax = 0 sea un plano en IR 3 . 


13. Escriba la forma escalonada reducida de una matriz A de 3 x 3 
de manera que las primeras dos columnas de A sean columnas 
pivote y 


3~ 


' 0 ' 

-2 

= 

0 

1 


0 


14. Determine el valor o valores de a de manera que 


a 

ci T 2 


sea linealmente independiente. 


4xi — 2x 2 + 7x3 = —5 
8xi — 3 x 2 + 10x 3 = — 3 

a) Defina vectores adecuados, y replantee el problema en tér¬ 
minos de combinaciones lineales. Luego, resuélvalo. 
tí) Defina una matriz adecuada, y replantee el problema utili¬ 
zando la frase “columnas de A”, 

c) Defina una transformación lineal T adecuada empleando la 
matriz en tí), y exponga el problema en términos de T. 

7. Considere el problema de determinar si el siguiente sistema de 
ecuaciones es consistente para toda bu b 2 , by. 

2x\ — 4x 2 — 2x 3 = b i 
—5xi T x 2 T x 3 — b 2 
lx\ — 5x 2 — 3x3 = b¡ 

a) Defina vectores adecuados y replantee el problema en térmi¬ 
nos de Gen [vi, v 2 , v 3 }. Luego, resuélvalo. 
tí) Defina una matriz adecuada y replantee el problema utili¬ 
zando la frase “columnas de A”. 


15. En a) y tí), suponga que los vectores son linealmente indepen¬ 
dientes. ¿Qué puede decir acerca de los números a,...,/? Justi¬ 
fique sus respuestas. [Sugerencia: Utilice un teorema para tí)]. 



a 


~b 


d 

0 


c 

, 

e 

_ 0 _ 


0 




16. Con base en el teorema 7 de la sección 1.7, explique por qué las 
columnas de la matriz A son linealmente independientes. 
' 1000 ' 

2 5 0 0 

“ 3 6 8 0 

4 7 9 10 


17. Explique por qué un conjunto {vi, v 2 , v 3 , V 4 } en IR 5 debe ser 
linealmente independiente cuando [vi, v 2 , v 3 } es linealmente 
independiente y V 4 no está en Gen [vi, v 2 , v 3 }. 


18. Suponga que (vi, v 2 ) es un conjunto linealmente independiente 
en IR". Demuestre que [vi, + v 2 } también es linealmente in¬ 
dependiente. 
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19. Suponga que Vi, V 2 , V 3 son distintos puntos sobre una línea 
en IR 3 . La recta no necesita pasar por el origen. Demuestre que 
¡vi, V 2 , V3} es linealmente dependiente. 

20. Sea T : IR" —> IR"' una transformación lineal, y suponga que 
T(u) = v. Demuestre que T(— u) = — v. 

21. Sea T : IR 3 -> IR 3 una transformación lineal que refleja cada 
vector a través del plano X 2 = 0. Es decir, 7Txi, X 2 , X 3 ) = (x¡, 
—X 2 , X 3 ). Encuentre la matriz estándar de T. 

22. Sea A una matriz de 3 x 3 con la propiedad de que la transfor¬ 
mación lineal x >-» Ax mapea IR 3 sobre IR 3 . Explique por qué la 
transformación debe ser uno a uno. 

23. Una rotación de Givens es una transformación lineal de IR" a IR" 
empleada en programas de cómputo para crear una entrada cero 
en un vector (por lo general, una columna de una matriz). La 
matriz estándar de una rotación de Givens en IR 2 tiene la forma 



Encuentre ay b tales que ^ gire a 




24. La siguiente ecuación describe una rotación de Givens en IR 3 . 
Encuentre a y b. 

'a 0 -bl [21 [2v/5~ 

0 1 0 3 = 3 , a 2 + b 2 = 1 

b 0 a_ _ 4_ 0 


25. Un gran edificio de apartamentos se construirá empleando técni¬ 
cas de construcción modular. El arreglo de los apartamentos, en 
cualquier piso en particular, se selecciona a partir de tres planes 
básicos. El plan A tiene 18 apartamentos en un piso, incluyendo 
3 unidades de 3 recámaras, 7 unidades de 2 recámaras, y 8 uni¬ 
dades de 1 recámara. Cada piso del plan B incluye 4 unidades de 
3 recámaras, 4 unidades de 2 recámaras, y 8 unidades de 1 re¬ 
cámara. Cada piso del plan C tiene 5 unidades de 3 recámaras, 3 
unidades de 2 recámaras, y 9 unidades de 1 recámara. Suponga 
que el edificio tiene un total de x\ pisos del plan A, xj pisos del 
plan B, y X 3 pisos del plan C. 


a) ¿Qué interpretación puede darse al vector Xi 



b) Escriba una combinación lineal formal de vectores que ex¬ 
prese el número total de apartamentos de una, dos y tres re¬ 
cámaras del edificio. 

c) [M] ¿Es posible diseñar el edificio con exactamente 66 uni¬ 
dades de tres recámaras. 74 unidades de dos recámaras, y 
136 unidades de una recámara? Si es así, ¿existe más de una 
forma de hacerlo? Explique su respuesta. 




EJEMPLO INTRODUCTORIO 


Modelos de computadora en el 
diseño de aeronaves 



Álgebra de matrices 


Para diseñar la siguiente generación de aeronaves comerciales 
y militares, los ingenieros de Boeing’s Phantom Works usan 
el modelado tridimensional (3D) y la dinámica de fluidos 
computacional (DFC). De esta manera, estudian el flujo de 
aire alrededor de un avión virtual para responder importantes 
preguntas de diseño antes de crear los modelos físicos. 

Este método ha reducido en forma drástica los tiempos y 
costos del ciclo de diseño; y el álgebra lineal desempeña 
un papel de suma importancia en el proceso. 

La aeronave virtual comienza como un modelo matemá¬ 
tico “de alambre” que existe solo en la memoria de la compu¬ 
tadora y en las terminales de presentación gráfica. (Se muestra 
el modelo de un Boeing 777). Este modelo matemático 
organiza e influye en cada paso del diseño y la manufactura 
de la aeronave, tanto en el exterior como en el interior. 

El análisis de DFC concierne a la superficie exterior. 

Aunque tal vez el acabado exterior de la aeronave 
parezca liso, la geometría de la superficie es complicada. 
Además de alas y fuselaje, un avión tiene cabinas, estabili¬ 
zadores, dispositivos de sustentación, aletas y alerones. 

La forma en que el aire fluye alrededor de estas estructuras 
determina cómo se desplaza la aeronave por el cielo. Las 
ecuaciones que describen el flujo del aire son complicadas y 
deben tomar en cuenta la admisión de los motores, los gases 
expelidos y las estelas que dejan las alas de la aeronave. Para 
estudiar el flujo del aire, los ingenieros necesitan de una des¬ 
cripción sumamente detallada de la superficie de la aeronave. 

Una computadora crea un modelo de la superficie al su¬ 
perponer, primero, una malla tridimensional de “cuadros” so¬ 
bre el modelo de alambre original. En esta malla, los cuadros 


caen completamente dentro o completamente fuera de la aero¬ 
nave, o se intersecan con la superficie de esta. La computadora 
selecciona los cuadros que se intersecan con la superficie 
y los subdivide, reteniendo solo los más pequeños que aún 
se intersecan con la superficie. El proceso de subdivisión se 
repite hasta que la malla se vuelve extremadamente fina. 

Una malla típica puede incluir más de 400,000 cuadros. 

El proceso para encontrar el flujo de aire alrededor de la 
aeronave implica la solución repetida de un sistema de ecuacio¬ 
nes lineales Ax = b que puede implicar hasta dos millones de 
ecuaciones y variables. El vector b cambia a cada momento, con 
base en datos que provienen de la malla y de las soluciones de 
ecuaciones previas. Usando las computadoras más rápidas dis¬ 
ponibles comercialmente, un equipo de Phantom Works puede 
tardar desde unas cuantas horas hasta varios días para configurar 
y resolver un solo problema de flujo de aire. Después de que el 
equipo analiza la solución, podrá hacer pequeños cambios en la 
superficie de la aeronave, y comenzar de nuevo todo el proceso. 
Es posible que se necesiten miles de corridas de DFC. 

En este capítulo se presentan dos conceptos importantes 
que ayudan en la solución de los enormes sistemas de 
ecuaciones de este tipo: 

• Matrices particionadas: Un sistema típico de ecuacio¬ 
nes de DFC tiene una matriz de coeficientes “dispersa” 
con la mayoría de entradas iguales a cero. El agrupar 
las variables en forma correcta conduce a una matriz 
particionada con muchos bloques de ceros. En la 
sección 2.4 se presenta este tipo de matrices y se 
describen algunas de sus aplicaciones. 
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• Factorizaciones de matrices: El sistema de 
ecuaciones es complicado, incluso cuando está 
escrito con matrices particionadas. Para simplificar 
aún más los cálculos, el programa computacional 
DFC aplicado en el Boeing utiliza lo que se conoce 
como factorización LU de la matriz de coeficientes. 
En la sección 2.5 se analiza la factorización LU y 
otras factorizaciones matriciales útiles. Más adelante, 
en varias partes de este libro, aparecen más detalles 
respecto de las factorizaciones. 

Para poder analizar una solución de un sistema de flujo 
de aire, los ingenieros tienen que visualizar el flujo de aire 
sobre la superficie de la aeronave; para ello, utilizan gráficos 
generados por computadora, y el álgebra lineal proporciona 
las herramientas para trazarlas. El modelo de marco de 
alambre de la superficie de la aeronave se almacena como 
datos en muchas matrices. Una vez que se presenta la imagen 
en una pantalla de computadora, los ingenieros pueden 
modificarla a escala, hacer acercamientos y alejamientos 



La moderna DFC ha revolucionado el diseño de aeronaves. 

El Boing Blended Wing Body se encuentra en diseño y entrará 
en funcionamiento en 2020 o tal vez antes. 


de zonas pequeñas, y hacerla girar para ver partes que 
quedan ocultas en determinado ángulo. Cada una de estas 
operaciones se realiza con una multiplicación adecuada de 
matrices. En la sección 2.7 se explican las ideas básicas. 


Nuestra capacidad para analizar y resolver ecuaciones aumentará considerablemente al adqui¬ 
rir la habilidad de realizar operaciones algebraicas con matrices. Más aún, las definiciones y 
los teoremas de este capítulo ofrecen algunas herramientas básicas para manejar las múltiples 
aplicaciones del álgebra lineal que implican dos o más matrices. Para matrices cuadradas, el 
teorema de la matriz invertible de la sección 2.3 reúne la mayoría de los conceptos tratados 
anteriormente en el libro. En las secciones 2.4 y 2.5 se examinan matrices particionadas y 
factorizaciones de matrices, las cuales aparecen en la mayor parte de los usos modernos del 
álgebra lineal. En las secciones 2.6 y 2.7 se describen dos aplicaciones interesantes del álge¬ 
bra de matrices a la economía y a los gráficos generados por computadora. 


2.1 


OPERACIONES 


DE MATRICES 


Si A es una matriz de m x n. es decir, una matriz con m filas y n columnas, entonces la entrada 
escalar en la í-ésima fila y la y-ésima columna de A se denota mediante a¡j y se llama entra¬ 
da (i, j) de A. Véase la figura 1. Por ejemplo, la entrada (3, 2) es el número «32 en la tercera 
fila, segunda columna. Cada columna de A es una lista de m números reales, que identifica 
un vector en IR”'. Con frecuencia, estas columnas se denotan mediante ai,..., a„, y la matriz 
A se escribe como 


A = [ai a 2 ••• a„] 

Observe que el número a¡j es la í-ésima entrada (desde arriba) del y-ésimo vector columna ay. 

Las entradas diagonales en una matriz A = [c/ y ] de m x n son au, a 22 , <233,..., y for¬ 
man la diagonal principal de A. Una matriz diagonal es una matriz cuadrada de n x n 
cuyas entradas no diagonales son cero. Un ejemplo es la matriz identidad de n x n, 
Una matriz de m x n cuyas entradas son todas cero es una matriz cero o matriz nula y se es¬ 
cribe como 0. El tamaño de una matriz cero, por lo general, es evidente a partir del contexto. 
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Columna 




J 



Cl ll 

' ‘ « 1 / ' 

a \n 

Fila i 

a¡ i 

• • a u 

' * ®in 


_ 1 

&mj 

Ümn 


T t T 

ai a H 

FIGURA 1 Notación matricial. 


Suma y múltiplos escalares 

La aritmética para vectores que se describió anteriormente tiene una extensión natural hacia 
las matrices. Se dice que dos matrices son iguales si tienen el mismo tamaño (es decir, el 
mismo número de fdas y de columnas) y si sus columnas correspondientes son iguales, lo 
que equivale a decir que sus entradas correspondientes son iguales. Si A y B son matrices de 
m x n. entonces la suma A + B es la matriz de m x n cuyas columnas son las sumas de las 
columnas correspondientes en Ay B. Puesto que la suma vectorial de las columnas se realiza 
por entradas, cada entrada en A + B es la suma de las entradas correspondientes de A y B. 
La suma A + B está definida solo cuando Ay B son del mismo tamaño. 

EJEMPLO 1 Sean 


Luego, 


B = 


C = 


2 -3 
0 1 


A+ B 


pero A + C no está definida porque Ay C tienen diferentes tamaños. ■ 

Si r es un escalar y A es una matriz, entonces el múltiplo escalar rA es la matriz cuyas 
columnas son r veces las columnas correspondientes de A. Al igual que sucede con los vecto¬ 
res, —A significa (— 1)A, y A — B es igual que A + (—1 )B. 


EJEMPLO 2 SiA y B son las matrices del ejemplo 1, entonces 


2 B 

A-IB 



' 1 

1 

r 


'2 

2 

2 ' 





2 

3 

5 

7 

— 

6 

10 

14 





" 

4 

0 

5' 


'2 

2 

2 ' 


2 

-2 

3' 


-1 

3 

2 


6 

10 

14 


-7 

-7 

-12 


En el ejemplo 2 no fue necesario calcular A — 2B como A + ( —1)25 porque las reglas 
usuales del álgebra se aplican a las sumas y los múltiplos escalares de matrices, como se verá 
en el siguiente teorema. 


Sean A,ByC matrices del mismo tamaño, y sean ry s escalares. 

a) A + B = B + A d) r(A + B) = rA + rB 

b) {A + B) + C = A + {B + C) e) (r + s)A = rA + sA 

c) A + 0 = A /) r(íA) = ( rs)A 


TEOREMA 1 



94 


CAPITULO 2 


Álgebra de matrices 


Cada igualdad del teorema 1 se comprueba al mostrar que la matriz del lado izquierdo 
tiene el mismo tamaño que la del lado derecho y que las columnas correspondientes son 
iguales. El tamaño no es problema porque A, B y C son del mismo tamaño. La igualdad de co¬ 
lumnas es consecuencia inmediata de las propiedades análogas de los vectores. Por ejemplo, 
si las columnas j-ésimas de A, B y C son a ¡, b, y c ; -, respectivamente, entonces las columnas 
y-ésimas de (A + B) + C y de A + (B + C) son 

(a i + b /> + c i y + (b i + C/), 

respectivamente. Ya que estas dos sumas vectoriales son iguales para cada y, la propiedad b) 
queda comprobada. 

Debido a la propiedad asociativa de la suma, se puede escribir simplemente A + B + C 
para la suma, lo cual se calcula como (A + B) + C, o bien, como A + (B + C). Lo mismo se 
aplica a sumas de cuatro o más matrices. 

Multiplicación de matrices 

Cuando una matriz B multiplica a un vector x, transforma a x en el vector Bx. Si después 
este vector se multiplica, a la vez, por una matriz A, el vector resultante es A(Bx). Véase la 
figura 2. 


Multiplicación 
por B 


Multiplicación 
por A 


Bx 


A(Bx) 


FIGURA 2 Multiplicación por B y luego por A. 


Así, A[Bx) se produce a partir de x por una composición de mapeos, las transformaciones 
lineales estudiadas en la sección 1.8. Nuestro objetivo es representar este mapeo compuesto 
como la multiplicación por una sola matriz, que se denota con AB , de manera que 

A(Bx) = ( AB)x (1) 


Véase la figura 3. 


Multiplicación 
por B 


Multiplicación 
por A 


Bx 


• A(Bx ) 


FIGURA 3 Multiplicación por AB. 


Multiplicación 
por AB 


Si A es de m x n, B es de n x p y x está en las columnas de B se denotan como 
b/,. .., b p , y las entradas de x como x\,. .., x p . Por consiguiente, 

Bx = xibi + ••• + x p bp 


Por la linealidad de la multiplicación por A, 


A(Bx) = A(xibi) -I-h A(Xpbp) 

= X\ Abj + • • • + XpAbp 
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DEFINICIÓN 


El vector A(Bx) es una combinación lineal de los vectores /ib i, A b ; „ usando las entradas 
de x como pesos. En notación matricial, esta combinación lineal se escribe como 

A(Bx) = [Abi Ab 2 ••• Ab^Jx 

Así, la multiplicación por [Ab¡ Ab 2 Ab ;) ] transforma a x en A(Bx). ¡Ya encontramos 
la matriz buscada! 


Si A es una matriz de m x n, y si B es una matriz den x p con columnas h |,..., b ;) enton¬ 
ces el producto AB es la matriz de m x p cuyas columnas son Abi,..., Ab ;) . Es decir, 

AB = A[b] b 2 ••• b p ] = [Abi Ab 2 ••• Ab /; ] 


Esta definición hace que la ecuación (1) sea verdadera para toda x en RC La ecua¬ 
ción (1) demuestra que el mapeo compuesto de la figura 3 es una transformación lineal y que 
su matriz estándar es AB. La multiplicación Be matrices corresponde a la composición de 
transformaciones lineales. 


EJEMPLO 3 Calcule AB, donde A 


y b 


SOLUCIÓN Escriba# = [bi b 2 b 3 ], y calcule: 
'2 


Abi = 


11 

-1 

L 


3' 

-5 

'4' 

1 

, Ab 2 = 

'2 

1 - 

3' 

-5 

3' 

-2 

, Ab 3 = 

'2 

1 - 

“ 



0' 




"21" 




. 13 




-9 


Luego, 


AB = A[bi b 2 b 3 


11 

0 

21 

-1 

13 

-9 

t 

t 

t 

Abi 

Ab 2 

Ab 3 


Observe que como la primera columna de AB es Abi, esta columna es una combinación 
lineal de las columnas de A usando como pesos las entradas de bj. Un enunciado similar es 
verdadero para cada columna de AB. 


Cada columna de AB es una combinación lineal de las columnas de A usando pesos de 
la columna correspondiente de B. 


Evidentemente, el número de columnas de A debe corresponder al número de filas en B 
para que una combinación lineal como Abi esté definida. Además, la definición de AB mues¬ 
tra que AB tiene el mismo número de filas que Ay el mismo número de columnas que B. 

EJEMPLO 4 SiA es una matriz de 3 x 5 y B una matriz de 5 x 2, ¿cuáles son los tamaños 
de AB y de BA, si tales productos están definidos? 
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SOLUCIÓN Como A tiene 5 columnas y B tiene 5 filas, el producto AB está definido y es una 
matriz de 3 x 2: 


A 


B AB 


* * * * 

* * * * 

* * * * 



3x5 Hay 5x2 
,, i correspon- ¿ 
dencia 

Tamaño de AB 


* * 
* * 
* * 

3x2 


El producto BA no está definido, porque las dos columnas de B no se corresponden con las 
tres filas de A. ■ 

La definición de AB es importante para el trabajo teórico y las aplicaciones, pero la 
siguiente regla ofrece un método más eficiente para calcular cada una de las entradas de AB 
cuando se resuelven a mano problemas sencillos. 


REGLA FILA-COLUMNA PARA CALCULAR AB 

Si el producto AB está definido, entonces la entrada en la fila i y la columna j de 
AB es la suma de los productos de las entradas correspondientes de la fila i de A y 
la columna j de B. Si ( AB)¡j denota la entrada (i, j) en AB , y si A es una matriz de 
m x n, entonces 

(AB)ij ci¡ i b \j -I - Qi 2 ^ 2 j a m b n j 


Para comprobar esta regla, sea B = [bi ••• b ; ,]. La columna j de AB es ,4b ; . y pode¬ 
mos calcular Ab,- usando la regla fila-vector para calcular Ax, como vimos en la sección 1.4. 
La í-ésima entrada de A b ; es la suma de los productos de entradas correspondientes de la 
fila i de A y del vector b ; , que es precisamente el cálculo descrito en la regla para calcular 
la entrada (i,j) de AB. 

EJEMPLO 5 Use la regla fila-columna para calcular dos de las entradas de AB para las 
matrices del ejemplo 3. Una inspección de los números implicados aclarará cómo los dos 
métodos para calcular AB producen la misma matriz. 

SOLUCIÓN Para encontrar la entrada de la fila 1 y la columna 3 de AB , considere la fila 1 
de A y la columna 3 de B. Multiplique las entradas correspondientes y sume los resultados, 
como se muestra a continuación: 


'2 3" 

'4 3 6' 


'□ □ 2(6)+ 3(3)' 


'□ □ 21' 

1 -5 

1 -2 3 


□ □ □ 


□ □ □ 


Para la entrada en la fila 2 y la columna 2 de AB. use la fila 2 de A y la columna 2 de B: 


\ 


'2 3" 

'4 3 6' 


'□ □ 21' 


'□ □ 21" 

1 -5 

1 -2 3 


□ 1(3) H—5(—2) □ 


□ 13 □ 
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EJEMPLO 6 Encuentre las entradas de la segunda fda de AB, donde 



SOLUCIÓN De acuerdo con la regla fda-columna, las entradas de la segunda fila de AB pro¬ 
vienen de la fda 2 de A (y de las columnas de B): 



□ 

□ 


"□ 

□ " 

-4 + 21-12 

6+3-8 


5 

1 

□ 

□ 


□ 

□ 

□ 

□ 


□ 

□ 


Observe que puesto que el ejemplo 6 pedía solamente la segunda fila de AB, se podría 
haber escrito solamente la segunda fila de A a la izquierda de B para calcular 


[-1 3 



[5 1 ] 


Esta observación acerca de las filas de AB es cierta en general, y es consecuencia de la regla 
fda-columna. Dejemos que fda, (A) denote la i-ésima fda de una matriz A. De esta forma, 


fda, (AB) = fila, (A) • B 


( 2 ) 


Propiedades de la multiplicación de matrices 

El siguiente teorema lista las propiedades estándar de la multiplicación de matrices. Recuerde 
que /,„ representa la matriz identidad de m x m, y que I m x = x para toda x en IR'". 


TEOREMA 2 


Sea A una matriz de m x n, y sean B y C matrices con tamaños para los que las sumas 
y los productos indicados están definidos. 

a) A(BQ = (AB)C 

(ley asociativa de la multiplicación) 

b ) A(B + C)= AB +AC 

(ley distributiva izquierda) 

c) (B + O A = BA + CA 

d) r{AB) = ( rA)B = A(rB) 

(ley distributiva derecha) 

para cualquier escalar r 


e) I m A = A = AI„ 

(identidad para la multiplicación de matrices) 


DEMOSTRACIÓN Las propiedades b) a e) se consideran en los ejercicios. La propiedad a) 
es consecuencia de que la multiplicación de matrices corresponde a la composición de trans¬ 
formaciones lineales (que son funciones) y se sabe (o es fácil comprobar) que la composición 
de funciones es asociativa. A continuación se presenta otra demostración de a) que se basa en 
la “definición de columna” del producto de dos matrices. Sea 


C = [ci ••• c p ] 
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WEB 


Por la definición de multiplicación de matrices, 

BC = [ Bci ■ ■ ■ Bc p ] 

A(BC)=[A(Bc l ) ••• A(Bc p )] 

Recuerde de la ecuación (1) que la definición de AB hace que A(Bx ) = (AB)x para toda x, de 
manera que 


A[BQ = [(AB)ci ••• (AB)c p \ = ( AB)C ■ 

Las leyes asociativa y distributiva de los teoremas 1 y 2 expresan, en esencia, que es po¬ 
sible agregar o eliminar parejas de paréntesis en expresiones matriciales de la misma manera 
que sucede en el álgebra de números reales. En particular, se puede escribir el producto como 
ABC y calcularlo ya sea como A(BC ) o (AB)C. 1 De manera similar, un producto de cuatro 
matrices ABCD se puede calcular como A{BCD ) o (ABC)D o A(BC)D, y así sucesivamente. 
No importa cómo se agrupen las matrices al realizar el cálculo de un producto, siempre y 
cuando se conserve el orden de izquierda a derecha de las matrices. 

El orden de izquierda a derecha en productos es importante porque, en general, AB y 
BA, no son iguales. Esto no es sorprendente, ya que las columnas de AB son combinaciones 
lineales de las columnas de A, mientras que las columnas de BA se construyen a partir de las 
columnas de B. La posición de los factores en el producto AB se enfatiza al decir que A se 
multiplica por la derecha por B o que B se multiplica por la izquierda por A. Si AB = BA, 
se dice que AyB conmutan una con la otra. 


EJEMPLO 7 


Sea 





0 

3 


. Muestre que estas matrices no 


conmutan. Es decir, compruebe que AB A BA. 
SOLUCIÓN 


AB 

BA 


r5 n 

'2 0" 


r i4 3i 

i — 

1 

N> 

l_ 

4 3 


i 

so 

1 

<N 

1 

'2 0" 

r 5 o 


' 10 2' 

4 3 

i— 

1 

N> 


29 -2 


El ejemplo 7 ilustra la primera de la siguiente lista de diferencias importantes entre el 
álgebra de matrices y el álgebra de números reales. Para ver ejemplos de estas diferencias, 
consulte los ejercicios 9 a 12. 


ADVERTENCIAS: 

1. En general, AB + BA. 

2. Las leyes de la cancelación no se aplican en la multiplicación de matrices. Es decir, 
si AB = AC, en general no es cierto que B = C. (Véase el ejercicio 10). 

3. Si un producto AB es la matriz cero, en general, no se puede concluir que A = 0 
o B = 0. (Véase el ejercicio 12). 


Potencias de una matriz 

Si A es una matriz de n x n y k es un entero positivo, entonces A k denota el producto de k 


1 Cuando B es cuadrada y C tiene menos columnas que las filas de A, es más eficiente calcular A(BC ) en vez de 
(AB)C. 
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TEOREMA 3 


copias de A: 


A k = A-■■A 

k 


Si A es diferente de cero y x está en IR", entonces A k x es el resultado de multiplicar repe¬ 
tidamente k veces a x por la izquierda por A. Si k = 0, entonces A°x debería ser la misma 
x. Por consiguiente, A° se interpreta como la matriz identidad. Las potencias de matrices 
son útiles tanto en la teoría como en las aplicaciones (secciones 2.6, 4.9, y más adelante 
en el libro). 


La transpuesta de una matriz 

Dada una matriz A de m x n. la transpuesta de A es la matriz de n x m, que se denota con A r , 
cuyas columnas se forman a partir de las filas correspondientes de A. 


EJEMPLO 8 Sean 




"-5 

2 "1 


a b 
c d 

, B = 

1 

0 

1 

m 

1 

, c = 


1 1 1 
5-2 7 


Por lo tanto, 



Sean A y B matrices cuyos tamaños son adecuados para las siguientes sumas y pro¬ 
ductos. 

a) (A T ) T = A 

b) (A + B) t = A t + B t 

c) Para cualquier escalar r, (rA) T = rA r 

d ) (AB) t = B t A t 


Las demostraciones de a) a c) son directas y se omiten. Para d ), véase el ejercicio 33. Por 
lo regular, (AB) T no es igual a A T B T , aun cuando Ay B tengan tamaños tales que el producto 
A t B t esté definido. 

La generalización del teorema 3 d) a productos de más de dos factores puede expresarse 
con palabras de la siguiente forma: 


La transpuesta de un producto de matrices es igual al producto de sus transpuestas en 
orden inverso. 


Los ejercicios incluyen ejemplos numéricos que ilustran las propiedades de las trans¬ 
puestas. 
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- NOTAS NUMÉRICAS - 

1. La manera más rápida de obtener AB en una computadora depende de la forma en 
que la computadora guarde las matrices en su memoria. Los algoritmos estándar de 
gran eficiencia, tales como los de LAPACK, calculan AB por columnas, como en 
nuestra definición del producto. (Una versión de LAPACK escrita en C++ calcula 
AB por filas). 

2. La definición de AB se presta en sí misma al procesamiento paralelo en una compu¬ 
tadora. Las columnas de B se asignan individualmente o en grupos a diferentes 
procesadores que, de manera independiente, y por lo tanto simultánea, calculan las 
columnas correspondientes de AB. 


PROBLEMAS DE PRÁCTICA 

1. Puesto que los vectores en R" se pueden considerar como matrices de n x 1, las propie¬ 
dades de las transpuestas del teorema 3 también se aplican a vectores. Sean 

, r i —3 1 [5' 

[- 2 4 J y x= k 

Calcule (Ax) r , x T A T , xx r y x'x. ¿Está definida A T x T 7 

2. Sean A una matriz de 4 x 4 y sea x un vector en R 4 . ¿Cuál es la forma más rápida de 
calcular A 2 x ? Cuente las multiplicaciones. 


2.1 EJERCICIOS 


En los ejercicios 1 y 2, calcule cada suma o producto si la matriz 
está definida. Si alguna expresión no está definida, explique por qué. 
Sean 



6 . 




4 

-2 


7. Si A es una matriz de 5 x 3 y el producto AB es 5 x 7, ¿cuál es 
el tamaño de 5? 

8. ¿Cuántas filas tiene B si BC es una matriz de 5x4? 


1. -2A,B-2A,AC,CD 

2. A + 3 B. 2C - 3 E. DB , EC 

En lo que resta de este conjunto de ejercicios y los que siguen, su¬ 
ponga que todas las expresiones matriciales están definidas. Es decir, 
los tamaños de las matrices y los vectores implicados “ajustan” de 
manera correcta. 


9. 


Sean A = 


2 

-1 



9 

k 


. ¿Qué valor(es) 


de k, si los hay, harán que AB = BA7 


10. Sea A = 




-3 

2 


-5 

1 


3. Sea A = 


2 -5 
-2 


calcule 3A — A y (3h)A. 


Compruebe que AB — AC y, sin embargo, B A C. 


L ~ J 


' 1 

2 

3" 


'5 

0 

0 ' 

4. Calcule A — 5/3 y ( 5 / 3 )A, donde 

11. Sean A = 

2 

4 

5 

y D = 

0 

3 

0 

r 5 -1 31 


3 

5 

6 


0 

0 

2 


A = 


-4 

-3 


3 -6 
1 2 


En los ejercicios 5 y 6 calcule el producto AB de dos maneras: a) con 
la definición, donde Abi y Ab 2 se calculan por separado, y tí) por la 
regla de la fila-columna para obtener AB. 

-1 3' 

1 

B = 


Calcule 


AD y DA. Explique cómo cambian las columnas o filas de A 
cuando se multiplica por D por la derecha o por la izquierda. 
Encuentre una matriz B de 3 x 3, que no sea la matriz identidad 
o la matriz cero, tal que AB = BA. 


5. A = 


12. Sea A = 


4 -2 
-2 3 


Construya una matriz B de 2 x 2 tal 


que AB sea igual a la matriz cero. Utilice para B dos diferentes 
columnas no nulas (distintas de cero). 
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13. Sean ri,..., r p vectores en IR", y sea Q una matriz de m x n. 
Escriba la matriz [Qr\ ■■■ <2r p ] como un producto de dos 
matrices (ninguna de ellas igual a la matriz identidad). 

14. Sea U la matriz de 3 x 2 de costos descrita en el ejemplo 6 
de la sección 1.8. La primera columna de U lista los costos 
por dólar de producción para elaborar el producto B, y la se¬ 
gunda columna lista los costos por dólar de producción para 
el artículo C. (Los costos están por categorías de materiales, 
mano de obra y gastos indirectos). Sea qi un vector en IR 2 
que liste la producción (medida en dólares) de los productos B 
y C manufacturados durante el primer trimestre del año, y 
sean q 2 , qj y qr los vectores análogos que listan las canti¬ 
dades de productos B y C manufacturados en el segundo, 
tercero y cuarto trimestres, respectivamente. Dé una des¬ 
cripción económica de los datos en la matriz UQ, donde 

Q = íqi q2 qs qr}- 

Los ejercicios 15 y 16 tratan de matrices arbitrarias A, B y C para 
las cuales las sumas y los productos indicados están definidos. 
Marque cada enunciado como verdadero o falso. Justifique sus 
respuestas. 


15. a) Si A y B son matrices de 2 x 2 con columnas ai, a 2 y bi, b 2 , 
respectivamente, entonces AB = [ajbi a 2 b 2 ]. 

tí) Cada columna de AB es una combinación lineal de las co¬ 
lumnas de B usando los pesos de la columna correspondiente 
de A. 

c) AB+ AC = A(B A O 

d) A T + B r = (A A B) t 

e) La transpuesta de un producto de matrices es igual al pro¬ 
ducto de sus transpuestas en el mismo orden. 


16. a) La primera fila de AB es la primera fila de A multiplicada 
por B por la derecha. 

b) Si A y 6 son matrices de 3 x 3 y B = [bi b 2 b 3 ], enton¬ 
ces AB = [Abi + Ab 2 + Ab 3 ], 

c) Si A es una matriz de n x n, entonces (A 2 ) T = (A 7 ) 2 

d) (ABC) 7 = C t A t B t 

e) La transpuesta de una suma de matrices es igual a la suma 
de sus transpuestas. 


17. Si A = 


y AB 


-3 

1 


-11 

17 


, determine la pri¬ 


mera y la segunda columnas de B. 


18. Suponga que la tercera columna de B está conformada en su 
totalidad por ceros. ¿Qué se puede decir acerca de la tercera 
columna de AS? 


19. Suponga que la tercera columna de B es la suma de las dos pri¬ 
meras columnas. ¿Qué se puede decir acerca de la tercera co¬ 
lumna de AS? ¿Por qué? 

20. Suponga que las dos primeras columnas de B, bi y b 2 , son 
guales. ¿Qué se puede decir acerca de las columnas de AB? 
¿Por qué? 

21. Suponga que la última columna de AB está conformada en su 
totalidad por ceros, pero B, por sí sola, no tiene columnas de 
ceros. ¿Qué se puede decir acerca de las columnas de A? 


22. Demuestre que si las columnas de B son linealmente depen¬ 
dientes, entonces también lo son las columnas de AB. 

23. Suponga que CA = /„ (la matriz identidad de n x n). Demuestre 
que la ecuación Ax = 0 tiene únicamente la solución trivial. 
Explique por qué A no puede tener más columnas que filas. 

24. Suponga que A es una matriz de 3 x n cuyas columnas ge¬ 
neran a IR 3 . Explique cómo construir una matriz D de n x 3 
tal que AD = T?. 

25. Suponga que A es una matriz de m x n, y que existan las ma¬ 
trices C y D de n x m, tales que CA = /„ y AD = De¬ 
muestre que m = n y C — D. [Sugerencia: Piense en el pro¬ 
ducto CAD ]. 

26. Suponga que AD = /„, (la matriz identidad de m x m). De¬ 
muestre que para toda b en IR'", la ecuación Ax = b tiene una 
solución. [Sugerencia: Piense en la ecuación ADb = b]. Expli¬ 
que por qué A no puede tener más filas que columnas. 


En los ejercicios 27 y 28, considere los vectores en IR" como ma¬ 
trices de n x 1. Para u y v en IR", el producto de matrices u r v es una 
matriz de 1 x 1 , que se llama producto escalar, o producto interno, 
de u y v. Por lo general, se escribe como un único número real sin 
corchetes. El producto de matrices uv r es una matriz de n x n, que 
se llama producto exterior de u y v. Los productos u 7 v y uv r se 
presentarán más adelante en el libro. 



"-3~ 


a 

27. Sea u = 

2 

y v = 

b 


-5 


c 


. Calcule u r v, v 7 u. uv r y vu r . 


28. Si u y v están en IR", ¿cómo se relacionan u r v y v 7 u? ¿Y cómo 
se relacionan uv r y vu 7 ? 


29. Compruebe el teorema 2b) y 2c). Use la regla fila-columna. 
La entrada (i,j) de A(B + C) se puede escribir como 

a¡](b]j A C\j) A A a¡ n (b n j A c n j) 
o 

n 

^ ' a¡k (bk¡ A ('k j ) 

k=1 


30. Compruebe el teorema 2 d). [Sugerencia: La entrada (i, j) en 
(ra a )bij A ••• A (ra in )b nj ]. 

31. Demuestre que I,„A = A, donde A es una matriz de m x n. 
Suponga que 7„,x = x para toda x en IR™. 

32. Demuestre que Al = A cuando A es una matriz de m x n. 
[Sugerencia: Use la definición (de columna) de A/,,]. 

33. Demuestre el teorema 3 d). [Sugerencia: Considere la y-ésima 
fila de (AB) 7 ]. 

34. Dé una fórmula para (ABx) 7 , donde x es un vector, y Ay B son 
matrices con los tamaños adecuados. 


35. [M] Lea la documentación de su programa de matrices y escriba 
los comandos que producirían las siguientes matrices (sin intro¬ 
ducir cada entrada de la matriz). 

a) Una matriz de 4 x 5 de ceros. 

b) Una matriz de 5 x 3 de unos. 

c) La matriz identidad de 5 x 5. 

d) Una matriz diagonal de 4 x 4, con entradas diagonales 3, 
4, 2, 5. 
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Una forma útil de someter a prueba ideas nuevas o de hacer con¬ 
jeturas en álgebra de matrices es realizar cálculos con matrices se¬ 
leccionadas en forma aleatoria. La comprobación de una propiedad 
para unas cuantas matrices no demuestra que la propiedad sea válida 
en general, pero permite que la propiedad sea más creíble. Además, 
es posible descubrir si una propiedad es falsa realizando unos cuan¬ 
tos cálculos. 

36. [M] Escriba el comando o los comandos necesarios para crear 
una matriz de 5 x 6 con entradas aleatorias. ¿Dentro de qué 
rango de números se encuentran las entradas? Diga cómo crear 
aleatoriamente una matriz de 4 x 4 con entradas enteras en¬ 
tre —9 y 9. [Sugerencia: Si x es un número aleatorio tal que 
0 < x < 1, entonces —9.5 < 19(.v — .5) < 9.5]. 

37. [M] Construya matrices aleatorias A y B de 4 x 4, y comprue¬ 
be si AB = BA. La mejor manera de hacer esto es calcular 
AB — BA y comprobar si esta diferencia es la matriz cero. Des¬ 
pués compruebe AB — BA para tres pares más de matrices alea¬ 
torias de 4 x 4. Escriba un informe de sus conclusiones. 

38. [M] Construya una matriz aleatoria A de 5 x 5 y compruebe 
si ( A + 7)(A — 7) = A 2 — 7. La mejor manera de hacer esto es 
calcular (A + 7)(A — I) — (A 2 — /), y verificar que esta dife¬ 
rencia sea la matriz cero. Realícelo para tres matrices al azar. 


Luego, someta a prueba (A + B)(A — B) = A 2 — B 2 de la misma 
forma para tres pares de matrices aleatorias de 4 x 4. Escriba un 
informe de sus conclusiones. 


39. [M] Use al menos tres pares de matrices aleatorias A y B de 
4x4 para someter a prueba las igualdades (A + B) T = A T + B T 
y ( AB) t = B t A t , así como (AB) T = A r B T (Véase el ejercicio 37). 
Escriba un informe de sus conclusiones. [Nota: La mayoría de 
los programas de matrices usan A' para representar A r ], 


40. [M] Sea 



'0 

1 

0 

0 

0 


0 

0 

1 

0 

0 

5 = 

0 

0 

0 

1 

0 


0 

0 

0 

0 

1 


0 

0 

0 

0 

0 

Calcule S k para 

k = 2, 

...6. 


[M] Describa con palabras qué 

A 20 y A 30 para 





'1/4 


1/2 

1/4 

- 

A = 

1/2 


1/3 

1/6 



1/4 


1/6 

7/12 



SOLUCIONES A LOS PROBLEMAS DE PRACTICA 


1. Ax = 


'1-3' 

'5' 


'-4' 

-2 4 

3 _ 


2 


. De manera que (Ax) r = [—4 2], También, 


" T A T = [ 5 3] 


1 -2 
-3 4 


= [-4 2] 


Las cantidades (Ax) r y x T A T son iguales, por el teorema 3 d). Después, 


xx 


T 



3 ] 


25 15 

15 9 


x r x = [ 5 



[25 + 9] = 34 


Una matriz de 1 x 1 como x 7 x generalmente se escribe sin corchetes. Por último, A T x T 
no está definida, ya que x T no tiene dos filas que correspondan a las dos columnas 
de A T . 

2. La manera más rápida de calcular A 2 x es calculando A(Ax). El producto Ax requiere 
16 multiplicaciones, 4 por cada entrada, y A(Ax) requiere 16 más. En contraste, el pro¬ 
ducto A 2 requiere 64 multiplicaciones, 4 por cada una de las 16 entradas en A 2 . Después 
de eso, A 2 x requiere 16 multiplicaciones más, para un total de 80. 


2.2 LA INVERSA DE UNA MATRIZ 

El álgebra de matrices brinda herramientas para manejar ecuaciones matriciales y crear di¬ 
versas fórmulas útiles, de manera similar a lo que sucede en el álgebra con números reales. 
En esta sección se investiga el análogo matricial del recíproco, o inverso multiplicativo, de un 
número diferente de cero. 
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Recuerde que el inverso multiplicativo de un número como 5 es 1/5 o 5 1 . Este inverso 
satisface la ecuación 


5 _1 -5 = 1 y 5 - 5 1 = 1 

La generalización matricial requiere ambas ecuaciones y evita la notación con diagonales 
(para división), ya que la multiplicación de matrices no es conmutativa. Además, una genera¬ 
lización completa solo es posible si las matrices implicadas son cuadradas. 1 

Se dice que una matriz A de n x n es invertible si existe otra matriz C de n x n tal que 

CA = I y AC = 1 

donde I = /„, la matriz identidad de n x n. En este caso, C es una inversa de A. En efecto, 
C está determinada únicamente por A, ya que si B fuera otra inversa de A, entonces B = 
BI = B(AC) = ( BA)C = IC = C. Esta inversa única se denota mediante A -1 , tal que, 

A~ l A=I y AA- 1 = I 


Una matriz que no es invertible en ocasiones se llama matriz singular, y una matriz invertible 
se llama matriz no singular. 


EJEMPLO 1 Si A 

AC 

CA 



Por lo tanto, C = 


A continuación se presenta una fórmula sencilla para la inversa de una matriz de 2 x 2, 
junto con una prueba para saber si existe la inversa. 


TEOREMA 4 


Sea A = 


. Si ad — be A 0, entonces A es invertible y 


A" 1 = 


1 


ad — be 

Si ad — be = 0, entonces A no es invertible. 


d —b 
—c a 


La sencilla demostración del teorema 4 se esboza en los ejercicios 25 y 26. La cantidad 
ad — be se llama determinante de A, y se escribe como 


det A = ad — be 


El teorema 4 establece que una matriz A de 2 x 2 es invertible si y solo si det A A 0. 


1 Podría decirse que una matriz A de m x n es invertible si existen matrices C y D de n x m. tales que CA = /„ y 
AD = I m . Sin embargo, estas ecuaciones implican que A es cuadrada y C = D. Por lo tanto, A es invertible como 
ya se definió. Véase los ejercicios 23 a 25 en la sección 2.1. 
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TEOREMA 5 


EJEMPLO 2 Encuentre la inversa de A = 


4 

6 


SOLUCIÓN Ya que det A = 3(6) — 4(5) = — 2 + O, A es invertible, y 


1 

6 -4' 


6 /(—2) —4/(—2)" 


' -3 2 

-2 

-5 3 


_ —5/(—2) 3/(— 2 ) _ 


5/2 -3/2 


Las matrices invertibles son indispensables en álgebra lineal, sobre todo para cálculos 
algebraicos y deducciones de fórmulas, como en el teorema siguiente. En ocasiones, una 
matriz inversa permite entender mejor un modelo matemático de alguna situación de la vida 
real, como en el ejemplo 3 que se presenta un poco más adelante. 


Si A es una matriz invertible de n x n, entonces, para cada b en IR", la ecuación Ax = b 
tiene la solución única x = A~ 'b. 


DEMOSTRACIÓN Tome cualquier b en R". Existe una solución porque cuando se susti- 
tuyeA^'bporx, se tiene Ax = A(A _ 1 b) = (AA _1 )b = 7b = b. Así que A~‘b es una solución. 
Para probar que la solución es única, demuestre que si u es cualquier solución, entonces u 
debe ser, de hecho, A 1 b. En efecto, si Au = b, podemos multiplicar ambos miembros por 
A -1 y obtener 

A _ 1 Au=A _ 1 b, 7u = A 'b y u = A 'b ■ 

EJEMPLO 3 Una viga elástica horizontal tiene soportes en cada extremo y está sujeta 
a fuerzas en los puntos 1, 2 y 3, como indica la figura 1. Sea f en R 3 tal que liste las fuerzas 
en estos puntos, y sea y en R 3 tal que liste las magnitudes de deflexión (es decir, de movi¬ 
miento) de la viga en los tres puntos. Con base en la ley de Hooke de la física, se puede 
demostrar que 

y = Df 

donde D es una matriz de flexibilidad. Su inversa se denomina matriz de rigidez. Describa 
el significado físico de las columnas de D y D 1 . 


#1 #2 #3 



SOLUCIÓN Escriba 73 = [ei e? 63 ] y observe que 

D — DI 3 — | /le De? /le; ] 

Interprete el vector e! = (1, 0, 0) como una fuerza unitaria aplicada hacia abajo en el punto 1 
(con fuerza cero en los otros dos puntos). De esta forma, /le], la primera columna de D, 
lista las deflexiones de la viga debidas a una fuerza unitaria en el punto 1. Descripciones 
similares son válidas para la segunda y tercera columnas de D. 

Para estudiar la matriz de rigidez 71 ', observe que la ecuación f = 71 1 v calcula un 
vector de fuerza f cuando se da un vector de deflexión y. Escriba 

D 1 = D~% = [ZT'e, 71 'e? ¿>'e 3 ] 

Ahora interprete e¡ como un vector de deflexión. De esta forma, 71 1 e] lista las fuerzas que 
crean la deflexión. Es decir, la primera columna de D 1 lista las fuerzas que deben aplicarse 
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en los tres puntos para producir una deflexión unitaria en el punto 1 y deflexión cero en los 
otros puntos. De manera similar, las columnas 2 y 3 de ZU 1 listan las fuerzas requeridas para 
producir deflexiones unitarias en los puntos 2 y 3, respectivamente. En cada columna, una o 
dos de las fuerzas deben ser negativas (apuntan hacia arriba) para producir una deflexión uni¬ 
taria en el punto deseado y deflexiones cero en los otros dos puntos. Si se mide la flexibilidad, 
por ejemplo, en pulgadas de deflexión por libra de carga, entonces las entradas de la matriz de 
rigidez están dadas en libras de carga por pulgada de deflexión. ■ 

La fórmula del teorema 5 se utiliza muy pocas veces para resolver en forma numérica 
una ecuación Ax = b porque la reducción por filas de [A b] casi siempre es más rápida. 
(La reducción por filas también es más precisa, en general, cuando los cálculos requieren el 
redondeo de los números). Una posible excepción es el caso 2 x 2, ya que los cálculos men¬ 
tales para resolver Ax = b en ocasiones resultan más fáciles usando la fórmula para A -1 , 
como en el siguiente ejemplo. 

EJEMPLO 4 Use la inversa de la matriz A del ejemplo 2 para resolver el sistema 

3xi + 4x2 = 3 
5x'i + 6 x 2 = 7 

SOLUCIÓN Este sistema es equivalente a Ax = b, por lo que 


' -3 2 

'3' 


5' 

5/2 -3/2 

7 


-3 


El siguiente teorema aporta tres datos útiles acerca de las matrices invertibles. 


TEOREMA 6 


a) Si A es una matriz invertible, entonces A 1 es invertible y 

(A ') 1 = A 

b ) Si A y B son matrices invertibles de n x n, entonces también lo es AB, y la inversa 
de AB es el producto de las inversas de Ay B en el orden opuesto. Es decir, 

(Afir 1 = B~ 1 A~ 1 

c ) Si A es una matriz invertible, también lo es A T , y la inversa de A r es la transpuesta 
de A -1 . Es decir, 

(A T r l = (A-y 


DEMOSTRACIÓN Para comprobar el enunciado a), se debe encontrar una matriz C tal que 

A- 1 C = I y CA- X =I 

De hecho, estas ecuaciones se satisfacen colocando a A en lugar de C. Por lo tanto, A -1 es 
invertible y A es su inversa. A continuación, para demostrar el enunciado b), se calcula: 

(ABXB'A- 1 ) = A(BB~ l )A 1 = A/A -1 = AA _1 = I 

Un cálculo similar indica que (B l A ¡ )(AB) = I. En el enunciado c) utilice el teorema 3 d), 
lea de derecha a izquierda, ( A~ l ) T A T = (AA~') r = f = I. De manera similar, A r (A _1 ) r = 
I T = I. Por lo tanto, A r es invertible, y su inversa es (A 1 ) / . ■ 

La siguiente generalización del teorema 6b) se necesitará más adelante. 


El producto de matrices invertibles de n x n es invertible, y la inversa es el producto de 
sus inversas en orden opuesto. 
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CAPITULO 2 


Álgebra de matrices 


Existe una conexión importante entre las matrices invertibles y las operaciones de fila 
que conduce a un método para calcular inversas. Como se verá, una matriz invertible A es 
equivalente por filas a una matriz identidad, y es posible encontrará 1 observando la reduc¬ 
ción por filas de A al. 


Matrices elementales 

Una matriz elemental es aquella que se obtiene al realizar una única operación elemental 
de fila sobre una matriz identidad. El siguiente ejemplo ilustra los tres tipos de matrices ele¬ 
mentales. 


EJEMPLO 5 Sean 



1 

0 

0 



"0 

1 

0 


■ 1 

0 

0" 

Ex = 

0 

1 

0 

, E 2 = 


1 

0 

0 

, E 3 = 

0 

1 

0 


-4 

0 

1 



0 

0 

1 


0 

0 

5 






r 

a 

b 

el 






A = 


d 

g 


e 

h 


f 


Calcule E\A, E 2 A y E 3 A , y describa cómo se pueden obtener estos productos por medio de 
operaciones elementales de fila sobre A. 


SOLUCIÓN Compruebe que 


a b 

C 


~d 

e 

r 

d e 

f 

, £ 2 ^4 = 

a 

b 

c 

1 

Q 

1 

_ 1 

i — 4c 


_g 

h 

i 


£ 3 A 


abe 
d e f 

5 g 5 h 5 i 


Al sumar a la fila 3 la fila 1 de A multiplicada por —4, se obtiene E\A. (Esta es una operación 
de remplazo de filas). Con un intercambio de las filas 1 y 2 de A se obtiene E 2 A, y multipli¬ 
cando la fila 3 de A por 5 se obtiene £3 A. ■ 

La multiplicación izquierda (es decir, multiplicación por la izquierda) por E¡ en el 
ejemplo 5 tiene el mismo efecto en cualquier matriz de 3 x n. Esta operación suma a la fila 3 
la fila 1 multiplicada por —4. En particular, ya que E\ ■ I = £), vemos que E¡ se autoproduce 
mediante esta misma operación de fila sobre la identidad. Así, el ejemplo 5 ilustra la siguien¬ 
te propiedad general de las matrices elementales. Véase los ejercicios 27 y 28. 


Si se realiza una operación elemental de fila con una matriz A de m x n, la matriz 
resultante se puede escribir como EA, donde la matriz E de m x m se crea al realizar 
la misma operación de fila sobre /,„. 


Puesto que las operaciones de fila son reversibles, como se demostró en la sección 1.1, 
las matrices elementales son invertibles, porque si E se produce aplicando una operación de 
fila sobre /, entonces existe otra operación de fila del mismo tipo que convierte a £ de nuevo 
en I. Por lo tanto, existe una matriz elemental F tal que FE = I. Puesto que Ey F correspon¬ 
den a operaciones inversas, también EF = I. 
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TEOREMA 7 


Toda matriz elemental E es invertible. La inversa de E es la matriz elemental del mismo 
tipo que transforma a £ de nuevo en I. 


EJEMPLO 6 Encuentre la inversa de E¡ 


1 0 0 
0 1 0 
-4 0 1 


SOLUCIÓN Para transformar E\ en /, sume la fila 1 multiplicada por +4 a la fila 3. La matriz 
elemental que hace esto es 


E 


-i 

i 


1 0 
0 1 
+4 0 


0 

0 

1 


El siguiente teorema ofrece la mejor manera de “visualizar” una matriz invertible, y con¬ 
duce de inmediato a un método para encontrar la inversa de una matriz. 


Una matriz A de n x n es invertible si y solo si A es equivalente por filas a /,„ y, en 
este caso, cualquier secuencia de operaciones elementales de fila que reduzca A a /„ 
también transforma a/„enA _I . 


DEMOSTRACIÓN Suponga que A es invertible. Entonces, como la ecuación ,4x = b tiene 
una solución para toda b (teorema 5), A tiene una posición pivote en cada fila (teorema 4 de 
la sección 1.4). Puesto que A es cuadrada, las n posiciones pivote deben estar sobre la diago¬ 
nal, lo que implica que la forma escalonada reducida de A es I n . Es decir, A ~ /„. 

A la inversa, ahora suponga que A ~ Entonces, puesto que cada paso de la reducción 
por filas de A corresponde a una multiplicación izquierda por una matriz elemental, existen 
matrices elementales E\,..., E P tales que 

A ~ E l A ~ E 2 (E l A) - E p {Ep-1 • • • EiA) = I„ 


Es decir, 


E p ■■■ E\A = I„ 

Puesto que el producto E p ,..., E¡ de matrices invertibles es invertible, (1) conduce a 


(E p — Ei)- l {E p — Ei)A = (E p — Ei)~ l I n 
A = (E p ■ ■ ■ E\)~ x 


( 1 ) 


Por lo tanto, A es invertible, porque es la inversa de una matriz invertible (teorema 6). 
También, 

A- 1 = [ (E p ■ ■ ■ Ei) -1 ]“' = E p — Ei 


Así, A 1 = E p ■■■ E\ ■ /„, lo que indica que A 1 resulta de aplicar E P sucesivamente 

a /„. Esta es la misma secuencia en (1) que redujo A a /„. ■ 


Un algoritmo para determinar A 1 

Si colocamos A e / lado a lado para formar una matriz aumentada [A /], entonces las 
operaciones de fila en esta matriz producen operaciones idénticas sobre Asi. De acuerdo 
con el teorema 7, hay operaciones de fila que transforman a A en /„ y a /„ en A -1 , o A no es 
invertible. 
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ALGORITMO PARA DETERMINAR A 1 

Reduzca por filas la matriz aumentada [A /]. Si A es equivalente por filas a /, en¬ 
tonces [A I] es equivalente por filas a [/ A -1 ]. De otra manera, A no tiene inversa. 


EJ EM PLO 7 Encuentre la inversa de la matriz A 


0 1 
1 0 
4 -3 


2 

3 

8 


si acaso existe. 


SOLUCIÓN 

[A I 


0 1 
1 0 
4 -3 

1 0 
0 1 
0 -3 

1 0 
0 1 
0 0 

1 0 
0 1 
0 0 


2 

3 

8 

3 

2 

-4 

3 

2 

1 

0 

0 

1 


1 0 
0 1 
o o 

0 1 

1 o 

O -4 


O 1 O 

1 O O 

3/2 -2 1/2 

-9/2 7 -3/2 

-2 4 -1 

3/2 -2 1/2 


1 O 
O 1 
4 -3 

1 O 
O 1 
O o 


3 

2 

8 

3 

2 

2 


O 1 O 
1 O o 
O O 1 

O 1 o 

1 o o 

3 -4 1 


El teorema 7 señala que, como A ~ /, A es invertible, y 


A" 1 


-9/2 7 -3/2 

-2 4 -1 

3/2 -2 1/2 


Es buena idea comprobar la respuesta final: 



"0 

1 

2" 

"-9/2 

7 

-3/2 


" 1 

0 

0" 

AA~' = 

1 

0 

3 

-2 

4 

-1 

= 

0 

1 

0 


4 

-3 

8 

3/2 

-2 

1/2 _ 


0 

0 

1 


No es necesario comprobar que A 'A 


/, ya que A es invertible. 


Otro punto de vista de la inversión de matrices 

Denote las columnas de /„ por ei,..., e„. De esta forma, la reducción por filas de [A I] a 
[/ A -1 ] se puede ver como la solución simultánea de los n sistemas 

Ax = ei, Ax = ej, ..., Ax = e„ (2) 

donde todas las “columnas aumentadas” de estos sistemas se han colocado al lado de A para 
formar [A ei ej e„] = [A /]. La ecuación ,4,4 1 = / y la definición de multiplicación 
de matrices indican que las columnas de A -1 son precisamente las soluciones de los siste¬ 
mas de (2). Esta observación es útil porque algunos problemas aplicados requieren encontrar 
solamente una o dos columnas de A -1 . En este caso, solo se necesita resolver los sistemas 
correspondientes en (2). 
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- NOTAS NUMÉRICAS - 

En la práctica, rara vez se calcula A -1 , a menos que se necesiten las entradas de A -1 . 
Calcular tanto A -1 como A ] b requiere aproximadamente tres veces más operaciones 
aritméticas que resolver con reducción por filas Ax = b, y la reducción por filas quizá 
resulte más precisa. 


PROBLEMAS DE PRÁCTICA 

1. Utilice determinantes para establecer cuáles de las siguientes matrices son invertibles: 



2.2 EJERCICIOS 

Encuentre las inversas de las matrices en los ejercicios 1 a 4. 



5. Utilice la inversa que encontró en el ejercicio 1 para resolver 
el sistema 

8xi + 6 x 2 = 2 
5xi + 4 x 2 = — 1 

6. Utilice la inversa que encontró en el ejercicio 3 para resolver el 
sistema 

7x¡ + 3x 2 = —9 
—6xi — 3x2 = 4 

_ „ , n 21 r-n „ r n. r 2 i 

7 - Sean ^ = [s I 2 j’ bl = [ 3 J ’ b2 = L-sJ’ 3 = Le. 

, r 3 1 
y b 4 = [ 5 _ ■ 

a) Determine A -1 y utilícela para resolver las ecuaciones 

Ax = bi, Ax = b 2 , Ax = b 3 , Ax = bu 

tí) Las cuatro ecuaciones del inciso a) se pueden resolver con el 
mismo conjunto de operaciones de fila, ya que la matriz de 
coeficientes es la misma en cada caso. Resuelva las cuatro 
ecuaciones del inciso a) mediante la reducción por filas de la 
matriz aumentada [A b 3 b 2 b 3 bj. 

8. Suponga que P es invertible y A = PBP l . Determine B en 
términos de A. 


En los ejercicios 9 y 10, marque cada enunciado como verdadero o 
falso. Justifique sus respuestas. 


9. a) Para que una matriz B sea la inversa de A, las ecuaciones 
AB = / y BA — I deben ser verdaderas. 

b) Si A y B son de n x n e invertibles, entonces A~ l B~ l es la 
inversa de AB. 


c) Si A = 

c 



ab — cd ¥= 0, entonces A es invertible. 


d ) Si A es una matriz invertible de n x n, entonces la ecuación 
Ax = b es consistente para toda b en IR". 


e) Toda matriz elemental es invertible. 


10. a) Si A es invertible, entonces las operaciones elementales 
de fila que reducen A a la identidad /„ también reducen 
A 1 a /„. 

b) SiA es invertible, entonces la inversaA -1 es A misma. 

c) Un producto de matrices invertibles de n x n es invertible, 
y la inversa del producto es el producto de sus inversas en el 
mismo orden. 

d) Si A es una matriz de n x n y Ax = e¿ es consistente para 
todaj e {1, 2,..., n), entonces A es invertible. Nota: ei,..., e„ 
representa las columnas de la matriz identidad. 

e) Si A puede reducirse por filas a la matriz identidad, entonces 
A debe ser invertible. 


11. Sea A una matriz invertible de n x n, y sea B una matriz de 
n x p. Demuestre que la ecuación AX = B tiene una solución 
única A~ l B. 


12. Utilice álgebra de matrices para demostrar que si A es inver¬ 
tible y D satisface AD = 7, entonces D — A -1 . 


13. Suponga que AB = AC, donde B y C son matrices de n x p y 
A es invertible. Demuestre que B = C. ¿Esto es cierto, en ge¬ 
neral, cuando A no es invertible? 
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14. Suponga que (B — C)D = 0, donde B y C son matrices de 
m x n y D es invertible. Demuestre que B — C. 

15. Sea A una matriz invertible de n x n, y sea B una matriz de 
n x p. Explique por qué A~ l B se puede calcular por reducción 
de filas: 

Si [A B] -[7 X], entonces X = A l B. 

Si A es mayor de 2 x 2, entonces la reducción por filas de 
[A B] es mucho más rápida que calcular a A -1 y a A~ l B. 

16. Suponga que Ay B son matrices de n x n, B es invertible y AB 
es invertible. Demuestre que A es invertible. [Sugerencia: Con¬ 
sidere que C = AB, y despeje A en esta ecuación], 

17. Suponga que A, B y C son matrices invertibles de n x n. 
Demuestre que ABC también es invertible al obtener una ma¬ 
triz D tal que (ABC)D = 7 y D(ABC) = 7. 

18. Resuelva la ecuación AB = BC para A, suponiendo que A, B 
y C son matrices cuadradas y B es invertible. 

19. Si A, B y C son matrices invertibles n x n, ¿la ecuación C _1 
(A + X)B~ l = 7„ tiene una solución, X? Si es así, encuéntrela. 

20. Suponga que A, B y X son matrices denxn con A, X y A — AX 
invertibles, y suponga que 

(A - AXT 1 = X~ l B (3) 

a) Explique por qué B es invertible. 

b) Despeje X en la ecuación (3). Si se necesita invertir una ma¬ 
triz, explique por qué esta matriz es invertible. 

21. Explique por qué las columnas de una matriz A de n x n son 
linealmente independientes cuando A es invertible. 

22. Explique por qué las columnas de una matriz A de n x n ge¬ 
neran a IR" cuando A es invertible. [Sugerencia: Repase el 
teorema 4 de la sección 1.4], 

23. Suponga que A es de n x n y que la ecuación Ax = 0 tiene 
solamente la solución trivial. Explique por qué A tiene n co¬ 
lumnas pivote y es equivalente por filas a 7„. De acuerdo con 
el teorema 7, esto indica que A debe ser invertible. (Este ejer¬ 
cicio y el 24 se mencionarán en la sección 2.3). 

24. Suponga que para una matriz A de n x n, la ecuación Ax = b 
tiene una solución para toda b en IR". Explique por qué A debe 
ser invertible. [Sugerencia: ¿A es equivalente por filas a 7,,?] 

Los ejercicios 25 y 26 demuestran el teorema 4 para 



27. Sea A una matriz de 3 x 3. 

a) Use la ecuación (2) de la sección 2.1 para demostrar que 
fila, (A) = fila, (7) • A, para i = 1, 2, 3. 

b) Demuestre que si las filas 1 y 2 de A se intercambian, en¬ 
tonces el resultado se puede escribir como EA, donde E 
es una matriz elemental formada al intercambiar las filas 1 
y 2 de 7. 

c) Demuestre que si la fila 3 de A se multiplica por 5, enton¬ 
ces el resultado se puede escribir como EA, donde E se 
forma al multiplicar la fila 3 de 7 por 5. 

28. Suponga que se remplaza la fila 2 de A por fila 2 (A) — 3 • fila; (A). 

Demuestre que el resultado es EA, donde E se forma a partir de 

7 al remplazar fila 2 (7) por fila 2 (7) — 3 • fila! (A). 


Encuentre las inversas de las matrices en los ejercicios 29 a 32, si 
existen. Use el algoritmo presentado en esta sección. 




6 

7 




2 

-7 

-6 


-1 

3 

4 


33. Use el algoritmo de esta sección para encontrar las inversas de 



0 



' 1 

0 

0 

0" 

' 1 

0 


1 

1 

0 

0 

1 

1 

1 

1 

0 

1 

y 

1 

1 

1 

0 




1 

1 

1 

1 


Sea A la matriz de n x n correspondiente, y sea B su inversa. 
Infiera la forma de B, y después demuestre que AB = I. 


34. Repita la estrategia del ejercicio 33 para inferir la inversa B de 


A = 


‘ 1 

2 

3 


n 


0 

2 

3 

n 


0 

0 

3 


n 


Demuestre que AB = 7. 


0' 

0 

o 


n 


35. 


Sea A = 



-7 -3 
15 6 

3 2 


Encuentre la tercera columna de 


A 1 sin calcular las otras columnas. 


25. Demuestre que si ad — be — 0, entonces la ecuación Ax = 0 
tiene más de una solución. ¿Por qué esto implica que A no es in¬ 
vertible? [Sugerencia: Primero, considere a = b = 0. Después. 


si a y b no son ambas cero, considere el vector x 



36. [M] Sea A = 


-25 

-9 

-27 

536 

185 

537 

154 

52 

143 


. Encuentre la segunda 


y tercera columnas de A 1 sin calcular la primera columna. 


26. Demuestre que si ad — be 0, la fórmula para A 1 funciona. 

Los ejercicios 27 y 28 demuestran casos especiales de los hechos 
acerca de matrices elementales establecidos en el recuadro que sigue 
al ejemplo 5. Aquí A es una matriz de 3 x 3 e 7 = 73 . (Una demos¬ 
tración general requeriría un poco más de notación). 


37. Sea A = 


1 

1 

1 


2 

3 

5 


. Construya una matriz C de 2 x 3 (por 


prueba y error) usando sólo 1, —1 y 0 como entradas, de tal 
forma que CA = 7 2 . Calcule AC y observe que AC A h. 
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Sea A = [o ¡ -¡ 

^ . Construya una matriz D, de 

41. [M] Sea 

I".0130 

.0050 

.0020 

.0010 

4x2, usando solo 1 

y 0 como entradas, de tal forma 

D = 

.0050 

.0100 

.0040 

.0020 

que AD = I 2 . ¿Es posible que CA = I 4 para alguna matriz C 

.0020 

.0040 

.0100 

.0050 

de 4x2? ¿Por qué? 



.0010 

.0020 

.0050 

.0130 


39. [M] Sea 


'.011 

.003 

.001 

D = .003 

.009 

.003 

.001 

.003 

.011 


una matriz de flexibilidad, con la flexibilidad medida en pul¬ 
gadas por libra. Suponga que se aplican fuerzas de 40, 50 y 
30 Ib sobre los puntos 1, 2 y 3, respectivamente, en la figura 1 
del ejemplo 3. Encuentre las deflexiones correspondientes. 

40. [M] Encuentre la matriz de rigidez D 1 para la D del ejer¬ 
cicio 39. Liste las fuerzas que se necesitan para producir una 
deflexión de .04 pulgadas en el punto 3, con deflexión cero en 
los otros puntos. 


la matriz de flexibilidad para una viga elástica, como la del 
ejemplo 3, con cuatro puntos en los que se aplican fuerzas. 
Las unidades son centímetros por newton de fuerza. Las me¬ 
diciones en los cuatro puntos identifican deflexiones de .07, 
.12, .16 y .12 cm. Determine las fuerzas presentes en los cua¬ 
tro puntos. 

42. [M] Con D como en el ejercicio 41, determine las fuerzas que 
producen una deflexión de .22 cm en el segundo punto de la 
viga, con deflexión cero en los otros tres puntos. ¿Cómo están 
relacionadas la respuesta al problema y las entradas de D l l 
[Sugerencia: Primero conteste la pregunta para una deflexión 
de 1 cm en el segundo punto]. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

= 3-6— (—9)-2 = 18 + 18 = 36. El determinante es diferente de 
cero, de manera que la matriz es invertible. 

"4 —9l 

b) det _ = 4 • 5 — (—9) ■ 0 = 20 7 ^ 0. La matriz es invertible. 

T 6 —9~| 

c) det ^ g = 6 • 6 — (—9)(—4) = 36 — 36 = 0. La matriz no es invertible. 

" 1 - 2-1 1 0 0 " 

2. [A / ] ~ —1 5 6 0 1 0 

5-45001 

" 1 - 2-1 1 0 0 " 

- 0 3 5 1 1 0 

0 6 10 -5 0 1 

" 1 - 2-1 1 0 0 " 

- 0 3 5 1 1 0 

0 0 0 -7 -2 1 

Así, [A /] es ahora equivalente por filas a la matriz de la forma [B D], donde B es una 
matriz cuadrada y tiene una fila de ceros. Las operaciones de fila adicionales no van a 
transformar a B en I, así que el proceso se detiene. A no tiene una inversa. 



2.3 CARACTERIZACIONES DE MATRICES INVERTIBLES 

Esta sección constituye un repaso de la mayoría de los conceptos estudiados en el capítulo 1, 
en relación con sistemas de n ecuaciones lineales de n incógnitas y con matrices cuadradas. 
El resultado principal es el teorema 8. 
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TEOREMA 8 El teorema de la matriz invertible 

Sea A una matriz cuadrada de n x n. Entonces, los siguientes enunciados son equiva¬ 
lentes. Es decir, para una A dada, los enunciados son todos ciertos o todos falsos. 

a) A es una matriz invertible. 

b) A es equivalente por filas a la matriz identidad de n x n. 

c ) A tiene n posiciones pivote. 

d) La ecuación Ax = 0 tiene solamente la solución trivial. 

é) Las columnas de A forman un conjunto linealmente independiente. 

/) La transformación lineal x >-> Ax es uno a uno. 

g ) La ecuación Ax = b tiene al menos una solución para toda b en R". 

h) Las columnas de A generan R". 

i) La transformación lineal x >-> Ax mapea R" sobre R". 

j) Existe una matriz C de n x n tal que CA = /, 

k) Existe una matriz Oden x n tal que AD = I. 

l) A 1 es una matriz invertible. 


(b) 



^ U 

(c) <= (d) 


FIGURA 1 


00 

(a) <= (g) 

(g) (h) <^> (i) 

(d) <^> (e) <=> (f) 

(a) <=> (1) 


Primero, se necesita alguna notación. Si la veracidad del enunciado a) siempre implica 
que el enunciado j) sea cierto, se dice que a) implica a/), y esto se representa como a) =>/). 
La demostración establecerá el “círculo” de implicaciones que se ilustra en la figura 1. Si 
cualquiera de estos cinco enunciados es cierto, entonces también lo son los demás. Por úl¬ 
timo, la demostración relacionará los enunciados restantes del teorema con los enunciados 
incluidos en este círculo. 

DEMOSTRACIÓN Si el enunciado a) es cierto, entonces A -1 funciona para C en j), de ma¬ 
nera que a) => j). Luego, j) => el) por el ejercicio 23 de la sección 2.1. (Regrese y lea el 
ejercicio). También, d) => c) por el ejercicio 23 de la sección 2.2. Si A es cuadrada y tiene 
n posiciones pivote, entonces los pivotes deben estar sobre la diagonal principal; en tal 
caso, la forma escalonada reducida de A es Por lo tanto, c) => b ). También, b) => a) por 
el teorema 7 de la sección 2.2. Esto completa el círculo de la figura 1. 

Ahora, a) => k) porque A -1 funciona para D. También, k) => g) por el ejercicio 26 de 
la sección 2.1, y g) => a) por el ejercicio 24 de la sección 2.2. Así que g) y k) están vincu¬ 
lados al círculo. Además, g ), h) e i) son equivalentes para cualquier matriz, de acuerdo con 
el teorema 4 de la sección 1.4 y el teorema 12a) de la sección 1.9. Por consiguiente, h) e i) 
están vinculados al círculo a través de g). 

Como d) está vinculado al círculo, también lo están é) y j), porque d), e) y/) son todos 
equivalentes para cualquier matriz A. [Véase la sección 1.7 y el teorema 1 2b) de la sección 
1.9]. Por último, a) => /) de acuerdo con el teorema 6c) de la sección 2.2, y I) => a) por el 
mismo teorema intercambiando A y A r . Esto completa la demostración. ■ 

Según el teorema 5 de la sección 2.2, el enunciado g) del teorema 8 también se podría 
escribir como: “La ecuación Ax = b tiene una solución única para toda b en R"”. Este enun¬ 
ciado realmente implica a b) y, por lo tanto, implica que A es invertible. 

El siguiente hecho es consecuencia del teorema 8 y del ejercicio 12 de la sección 2.2. 


Sean Ay B matrices cuadradas. Si AB = /, entonces Ay B son invertibles, con B = A 1 
yA = B l . 
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El teorema de la matriz invertible divide al conjunto de todas las matrices de n x n en 
dos clases disjuntas: las matrices invertibles (no singulares) y las matrices no invertibles (sin¬ 
gulares). Cada enunciado del teorema describe una propiedad de toda matriz de n x n inver¬ 
tible. La negación de un enunciado del teorema describe una propiedad de toda matriz 
singular de n x n. Por ejemplo, una matriz singular de n x n no es equivalente por fdas a /„, 
no tiene n posiciones pivote, y tiene columnas linealmente dependientes. Las negaciones de 
los otros enunciados se consideran en los ejercicios. 


EJEMPLO 1 Use el teorema de la matriz invertible para determinar si A es invertible: 



1 

0 

- 2 " 

A = 

3 

1 

-2 


-5 

-1 

9 


SOLUCIÓN 


1 

0 

-2 


"1 

0 

- 2 " 

0 

1 

4 


0 

1 

4 

0 

-1 

-1 


0 

0 

3 


Por lo que A tiene tres posiciones pivote y, por lo tanto, es invertible, de acuerdo con el enun¬ 
ciado c) del teorema de la matriz invertible. ■ 


El poder del teorema de la matriz invertible radica en las relaciones que establece entre 
tantos conceptos importantes, tales como la independencia lineal de las columnas de una 
matriz A y la existencia de soluciones para ecuaciones de la forma Ax = b. Sin embargo, se 
debe enfatizar que el teorema de la matriz invertible se aplica solo a matrices cuadradas. Por 
ejemplo, si las columnas de una matriz de 4 x 3 son linealmente independientes, no puede 
usarse el teorema de la matriz invertible para obtener cualquier conclusión acerca de la exis¬ 
tencia o inexistencia de soluciones a ecuaciones de la forma Ax = b. 


Transformaciones lineales invertibles 

Recuerde de la sección 2.1 que la multiplicación de matrices corresponde a la composición 
de transformaciones lineales. Cuando una matriz A es invertible, la ecuación A -1 Ax = x se 
puede ver como un enunciado acerca de transformaciones lineales. Véase la figura 2. 


Multiplicación 
por A 

x» «Ax 

Multiplicación 

por A ^ 1 

FIGURA 2 A~ l transforma Ax de regreso a x. 


Se dice que una transformación lineal T : R" —» R" es invertible si existe una función 
5 : R” -> R" tal que 

S(T(x)) = x para toda x en R" (1) 

T(S(x)) = x para toda x en R" (2) 

El siguiente teorema establece que si dicha S existe, es única y debe ser una transformación 
lineal. Se dice que S es la inversa de T y se escribe como T 1 . 
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TEOREMA 9 


WEB 


Sea T : IR" —» IR" una transformación lineal y sea A la matriz estándar para Así, 
T es invertible si y solo si A es una matriz invertible. En tal caso, la transforma¬ 
ción lineal S dada por S(x) = A 'x es la única función que satisface las ecuaciones 

(1) y (2). 


DEMOSTRACIÓN Suponga que T es invertible. Entonces (2) indica que T es sobre R", 
porque si b está en R" y x = S(b), entonces T(x) = 7T.S'(b)) = b, así que toda b está en el 
rango de T. Por lo tanto, A es invertible, de acuerdo con el teorema de la matriz invertible, 
enunciado i). 

Por el contrario, suponga que A es invertible y sea S(x) = A 'x. Entonces, S es una trans¬ 
formación lineal y evidentemente satisface (1) y (2). Por ejemplo, 

S(T(x)) = S(Ax) = A“'(Ax) = x 

Por consiguiente, T es invertible. La demostración de que S es única se describe de manera 
general en el ejercicio 38. ■ 

EJEMPLO 2 ¿Qué se puede decir acerca de una transformación lineal T uno a uno 
de R" en R ,! ? 

SOLUCIÓN Las columnas de la matriz estándar A de T son linealmente independientes 
(según el teorema 12 de la sección 1.9). Por lo que A es invertible, de acuerdo con el teo¬ 
rema de la matriz invertible, y T mapea R" sobre R". También, T es invertible, según el 
teorema 9. ■ 

- NOTAS NUMÉRICAS - 

En la práctica, se puede encontrar ocasionalmente una matriz “casi singular” o mal 
condicionada: una matriz invertible que puede convertirse en singular si algunas 
de sus entradas se modifican ligeramente. En este caso, es posible que la reducción 
por filas produzca menos de n posiciones pivote, debido al error de redondeo. Ade¬ 
más, los errores de redondeo, algunas veces, hacen que una matriz singular parezca 
invertible. 

Algunos programas de matrices calculan un número de condición para una ma¬ 
triz cuadrada. Cuanto mayor sea el número de condición, más cerca estará la matriz de 
ser singular. El número de condición de la matriz identidad es 1. Una matriz singular 
tiene un número de condición infinito. En casos extremos, un programa de matrices 
podría no distinguir entre una matriz singular y una matriz mal condicionada. 

Los ejercicios 41 a 45 ponen de manifiesto que los cálculos de matrices llegan 
a producir errores sustanciales cuando un número de condición es grande. 


PROBLEMAS DE PRÁCTICA 


1. Determine si A = 


2 

2 

2 


3 

3 

3 


4 

4 

4 


es invertible. 


2. Suponga que para cierta matriz A de n x n, el enunciado g) del teorema de la matriz 
invertible no es verdadero. ¿Qué puede decirse acerca de las ecuaciones de la forma 
Ax = b? 

3. Suponga que A y B son matrices de n x n y que la ecuación ABx = 0 tiene una solu¬ 
ción no trivial. ¿Qué puede decirse acerca de la matriz AB1 
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2.3 EJERCICIOS 


A menos que se especifique lo contrario, suponga que en estos ejer¬ 
cicios todas las matrices son de n x n. En los ejercicios 1 a 10, de¬ 
termine cuáles de las matrices son invertibles. Use tan pocos cálculos 
como sea posible. Justifique sus respuestas. 


1 . 


5 

-3 


7 

-6 



2 

-3 


3 

0 

0“ 



-3 

-4 

0 



8 

5 

—3 _ 



3 

0 

-3~ 



2 

0 

4 



—4 

0 

7 _ 



-1 

-3 

0 

1" 


3 

5 

8 

-3 


-2 

-6 

3 

2 


0 

-1 

2 

1 _ 



4 

0 

-3 

-7 

VI] 

-6 

9 

9 

9 

7 

-5 

10 

19 


-1 

2 

4 

-1 



10. [M] 


5 3 

6 4 

7 5 

9 6 

8 5 


1 7 9' 

2 8—8 

3 10 9 

4 -9 —5 

2 114 


En los ejercicios 11 y 12, todas las matrices son n x n. Cada inciso 
de estos ejercicios es una implicación de la forma “si (enunciado 1), 
entonces (enunciado 2)”. Marque cada implicación como verdadera 
o falsa, considerando lo siguiente. Una implicación es verdadera si 
el enunciado 2 es verdadero siempre que el enunciado 1 sea cierto. 
Una implicación es falsa si existe un caso en el que el enunciado 2 es 
falso, pero el enunciado 1 es verdadero. Justifique sus respuestas. 


11. a) Si la ecuación Ax = 0 tiene únicamente la solución trivial, 

entonces A es equivalente por filas a la matriz identidad de 
n x n. 

tí) Si las columnas de A generan a IR”, entonces las columnas 
son linealmente independientes. 

c) Si A es una matriz de n x n, entonces la ecuación Ax = b 
tiene al menos una solución para toda b en R”. 

d) Si la ecuación Ax = 0 tiene una solución no trivial, enton¬ 
ces A tiene menos de n posiciones pivote. 

e) Si A T no es invertible, entonces A no es invertible. 

12. a) Si existe una matriz D de n x n tal que AD = /, entonces 

DA = I. 

b ) Si la transformación lineal x f-» Ax mapea R” en R", enton¬ 
ces la forma escalonada reducida de A es I. 

c) Si las columnas de A son linealmente independientes, enton¬ 
ces las columnas de A generan a R". 


d) Si la ecuación Ax = b tiene al menos una solución para toda b 
en R", entonces la transformación x i-> Ax no es uno a uno. 

e) Si existe una b en R" tal que la ecuación Ax = b es con¬ 
sistente, entonces la solución es única. 

13. Una matriz triangular superior de m x n es aquella cuyas 
entradas debajo de la diagonal principal son ceros (como en el 
ejercicio 8). ¿Cuándo es invertible una matriz triangular supe¬ 
rior cuadrada? Justifique su respuesta. 

14. Una matriz triangular inferior de m x n es aquella cuyas 
entradas arriba de la diagonal principal son ceros (como en el 
ejercicio 3). ¿Cuándo es invertible una matriz triangular inferior 
cuadrada? Justifique su respuesta. 

15. ¿Puede ser invertible una matriz de 4 x 4, cuando sus columnas 
no generan a R 4 ? ¿Por qué? 

16. Si una matriz A de n x n es invertible, entonces las columnas 
de A T son linealmente independientes. Explique por qué. 

17. ¿Puede una matriz cuadrada con dos columnas idénticas ser 
invertible? ¿Por qué? 

18. ¿Puede una matriz cuadrada con dos filas idénticas ser inver¬ 
tible? ¿Por qué? 

19. Si las columnas de una matriz D, de 7 x 7, son linealmente 
independientes, ¿qué se puede decir acerca de las soluciones 
de Dx = b? ¿Por qué? 

20. Si A es una matriz de 5 x 5 y la ecuación Ax = b es consistente 
para toda b en R 5 , ¿es posible que, para alguna b, la ecuación 
Ax = b tenga más de una solución? ¿Por qué? 

21. Si la ecuación Cu = v tiene más de una solución para alguna 
v en R", ¿pueden las columnas de la matriz C de n x n generar 
a R"? ¿Por qué? 

22. Si las matrices E y F de n x n tienen la propiedad de que 
EF = /, entonces E y F conmutan. Explique por qué. 

23. Suponga que F es una matriz de n x n. Si la ecuación Fx = y 
es inconsistente para alguna y en R n , ¿qué se puede decir acerca 
de la ecuación Ex = 0? ¿Por qué? 

24. Si una matriz G de n x n no se puede reducir por filas a /,„ 
¿qué se puede decir acerca de las columnas de G? ¿Por qué? 

25. Compruebe el enunciado del recuadro antes del ejemplo 1. 

26. Explique por qué las columnas de A 2 generan a R" siempre que 
las columnas de una matriz A de n x n son linealmente inde¬ 
pendientes. 

27. Sean A y B matrices de n x n. Demuestre que siAB es invertible, 
también lo es A. No podrá utilizar el teorema 6 b), porque no es 
posible suponer que Ay B son invertibles. [Sugerencia: Existe 
una matriz W tal que ABW = I. ¿Por qué?]. 

28. Sean Ay B matrices de n x n. Demuestre que si AB es inver¬ 
tible, también B lo es. 

29. Si A es una matriz de n x n y la transformación x i-> Ax es uno 
a uno, ¿qué más puede decirse acerca de esta transformación? 
Justifique su respuesta. 



116 CAPÍTULO 2 Álgebra de matrices 


30. Si A es una matriz de n x n y la ecuación Ax = b tiene más de 
una solución para alguna b, entonces la transformación x i-> Ax 
no es uno a uno. ¿Qué más se puede decir acerca de esta trans¬ 
formación? Justifique su respuesta. 

31. Suponga que A es una matriz de n x n con la propiedad de que 
la ecuación Ax = b tiene al menos una solución para toda b 
en IR". Sin utilizar los teoremas 5 u 8 , explique por qué cada 
ecuación Ax = b tiene, en efecto, exactamente una solución. 

32. Suponga que A es una matriz de n x n con la propiedad de que 
la ecuación Ax = 0 tiene solamente la solución trivial. Sin uti¬ 
lizar el teorema de la matriz invertible, explique directamente 
por qué la ecuación Ax = b debe tener una solución para toda 
b en IR". 

En los ejercicios 33 y 34, T es una transformación lineal de IR 2 en IR 2 . 

Demuestre que T es invertible y encuentre una fórmula para T -1 . 

33. T(x i, X 2 ) — (—5xi + 9 .í 2 , 4xi — 7 x 2 ) 

34. T(x i, X 2 ) = (2x'i — 8 x 2 , — 2xi + 7 x 2 ) 

35. Sea T : IR" —» IR" una transformación lineal invertible. Expli¬ 
que por qué T es tanto uno a uno como sobre IR". Use las ecua¬ 
ciones (1) y (2). Después, dé una segunda explicación usando 
uno o más teoremas. 


41. [M] Suponga que un experimento conduce al siguiente sistema 

de ecuaciones: 

4.5xi + 3.1x 2 = 19.249 

(3) 

1.ÓX! + l.lx 2 = 6.843 

a) Resuelva el sistema (3), y después resuelva el sistema (4) 
que se presenta a continuación, en el cual los datos a la dere¬ 
cha se redondearon a dos decimales. En cada caso, encuentre 
la solución exacta. 

4.5xi + 3.1 x 2 = 19.25 

(4) 

1.6xi + l.lx 2 = 6.84 

b) Las entradas del sistema (4) difieren de las del sistema (3) en 
menos del .05%. Encuentre el porcentaje de error cuando se 
utiliza la solución de (4) como una aproximación a la solu¬ 
ción de (3). 

c) Use un programa de matrices para producir el número de 
condición de la matriz de coeficientes de (3). 

Los ejercicios 42, 43 y 44 ilustran cómo utilizar el número de con¬ 
dición de una matriz A para estimar la exactitud de una solución 
calculada de Ax = b. Si las entradas de A y b son exactas con apro¬ 
ximadamente r dígitos significativos, y si el número de condición 
de A es aproximadamente 10* (siendo k un entero positivo), entonces 
la solución calculada de Ax = b debería ser exacta hasta al menos 
r — k dígitos significativos. 


36. Suponga una transformación lineal T : IR" —» IR" con la pro¬ 
piedad de que 7\u) = T(\) para algún par de vectores distintos 
u y v en IR". ¿Puede T mapear IR" sobre IR"? ¿Por qué? 

37. Suponga que T y U son transformaciones lineales de IR" a 
IR" tales que T(U(x)) = x para toda x en IR". ¿Es cierto que 
U(T(x )) = x para toda x en IR"? ¿Por qué? 

38. Sea T : IR" —» IR" una transformación lineal invertible, y sean 
S y U funciones de IR" en IR" tales que S(T(x)) = x y 
U(T(x)) = x para toda x en IR". Demuestre que U(\) = S(v) 
para toda v en IR". Esto demostrará que T tiene una inversa 
única, como se establece en el teorema 9. [Sugerencia: Dada 
cualquier v en IR", se puede escribir v = T(x) para alguna x. 
¿Por qué? Calcule S(v) y U(v)\. 

39. Sea T una transformación lineal que mapea IR" sobre IR". 
Demuestre que T~ l existe y mapea IR" en IR". ¿T --1 es también 
uno a uno? 

40. Suponga que T y S satisfacen las ecuaciones de invertibilidad 
(1) y (2), donde T es una transformación lineal. Demuestre di¬ 
rectamente que S es una transformación lineal. [Sugeren¬ 
cia: Dadas u y v en IR", sea x = S(u), y = S(\). Entonces, 
T(x) = u, T{ y) = v. ¿Por qué? Aplique S a ambos miembros 
de la ecuación 7Tx) + T(y ) = T(x + y). También, considere 
T(cx) = c7Tx)]. 


42. [M] Sea A la matriz del ejercicio 9. Encuentre el número de 
condición de A. Construya un vector aleatorio x en IR 4 y calcule 
b = Ax. Después use un programa de matrices para calcular la 
solución xi de Ax = b. ¿En cuántos dígitos concuerdan x y x¡? 
Encuentre el número de dígitos que el programa de matrices 
almacena con precisión, e informe cuántos dígitos de exactitud 
se pierden cuando se usa x¡ en lugar de la solución exacta x. 

43. [M] Repita el ejercicio 42 para la matriz del ejercicio 10. 

44. [M] Resuelva la ecuación Ax = b para obtener una b que sirva 
para encontrar la última columna de la inversa de la matriz de 
Hilbert de quinto orden 

1 1/2 1/3 1/4 1/5' 

1/2 1/3 1/4 1/5 1/6 

A = 1/3 1/4 1/5 1/6 1/7 

1/4 1/5 1/6 1/7 1/8 

1/5 1/6 1/7 1/8 1/9 _ 

¿Cuántos dígitos de cada entrada de x espera que sean correc¬ 
tos? Explique su respuesta. [Nota: La solución exacta es (630, 
-12600, 56700, -88200, 44100)]. 

45. [M] Algunos programas de matrices, como MATLAB, tienen 
una orden para crear matrices de Hilbert de varios tamaños. Si 
es posible, use un comando inverso para calcular la inversa de 
una matriz de Hilbert A de duodécimo orden o mayor. Calcule 
AA _1 . Realice un informe de sus hallazgos. 
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SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Es evidente que las columnas de A son linealmente dependientes, ya que las columnas 
2 y 3 son múltiplos de la columna 1. Por lo tanto, A no puede ser invertible, de acuerdo 
con el teorema de la matriz invertible. 

2. Si el enunciado g) no es verdadero, entonces la ecuación Ax = b es inconsistente para al 
menos una b en IR". 

3. Aplique el teorema de la matriz invertible a la matriz AB en lugar de A. Entonces, el enun¬ 
ciado d ) se convierte en: “ABx = 0 tiene solamente la solución trivial”. Esto no es cierto. 
Por lo tanto, AB no es invertible. 


2.4 MATRICES PARTICIONADAS 


Una característica clave de nuestro trabajo con matrices ha sido la capacidad para considerar 
a una matriz A como una lista de vectores columna y no tan solo un arreglo rectangular de 
números. Este punto de vista ha resultado tan útil que sería deseable considerar otras parti¬ 
ciones de A, indicadas por las líneas divisorias horizontales y verticales, como en el ejemplo 
1 que se presenta a continuación. Las matrices particionadas se presentan en la mayoría de las 
aplicaciones modernas del álgebra lineal porque la notación resalta la estructura esencial de 
los cálculos matriciales, como se mostró en el ejemplo introductorio de este capítulo acerca 
del diseño de aeronaves. Esta sección ofrece una oportunidad para revisar el álgebra matricial 
y usar el teorema de la matriz invertible. 


EJEMPLO 1 La matriz 



"3 0-1 

5 9 

- 2 ' 

A = 

-5 2 4 

0 -3 

1 


-8 -6 3 

1 7 

-4 


también se puede escribir como la matriz particionada de 2 x 3 (o por bloques) de 


A = 


A n 
A 21 


A12 
^22 


A u 

A23 


cuyas entradas son los bloques (o las submatrices ) 



3 0-1' 

1 . 

'5 9' 

1 . 

'- 2 ' 

II 

-5 2 4 

to 

II 

0 -3 

II 

m 

1 


^21 


[-8 -6 3], A 22 = [ 1 


7], A 23 = [-4] ■ 



EJEMPLO 2 Cuando una matriz A se presenta en un modelo matemático de un sis¬ 
tema físico, como en una red eléctrica, un sistema de transporte o una gran compañía, tal 
vez resulte natural considerar A como una matriz particionada. Por ejemplo, si un tablero de 
circuitos de microcomputadora consta principalmente de tres microcircuitos VLSI ( very 
large-scale integrated, es decir, integrados a escala muy grande), entonces la matriz para el 
tablero de circuitos podría tener la forma general 


An 

A n 

An 

A 1X 

A 22 

A 23 

An 

A 32 

^33 


Las submatrices en la “diagonal” de A —a saber, An, A 22 y A 33 — se refieren a los tres cir¬ 
cuitos VLSI, mientras que las otras submatrices dependen de las interconexiones que haya 
entre esos microcircuitos. ■ 
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Suma y multiplicación escalar 

Si las matrices A y B son del mismo tamaño y están particionadas exactamente en la mis¬ 
ma forma, resulta natural efectuar una partición similar de la suma ordinaria matricial A + B. 
En este caso, cada bloque de A + B es la suma (matricial) de los bloques correspondientes 
de A y B. La multiplicación por un escalar de una matriz particionada también se calcula 
bloque por bloque. 


Multiplicación de matrices particionadas 

Las matrices particionadas se pueden multiplicar utilizando la regla fila-columna como si las 
entradas del bloque fueran escalares, siempre que para un producto AB, la partición por 
columnas de A equivalga a la partición por filas de B. 


EJEMPLO 3 Sean 



"2-3 1 

’xl- 

1 

o 

A = 

1 5 -2 

3 -1 


<N 

1 

’xl- 

1 

O 
_1 

7 -1 


r 6 4i 



5 2 


B i 
B 2 


Las cinco columnas de A están particionadas en un conjunto de tres columnas y, luego, 
en uno de dos columnas. Las cinco filas de B están particionadas de igual manera (en un 
conjunto de tres filas y después en uno de dos filas). Se dice que las particiones de A y B es¬ 
tán conformadas para la multiplicación por bloques. Es posible demostrar que el producto 
común AB se escribe como 








"-5 

4" 

'A u 

An 

'Bi~ 


’ A u Bi + A u B 2 ~ 


-6 

2 

A 2 i 

a 22 _ 

_ b 2 _ 


_ A 2 i B\ + A 22 B 2 _ 










2 

1 _ 


Es importante escribir cada producto menor de la expresión para AB con la submatriz 
de A a la izquierda, ya que la multiplicación de matrices no es conmutativa. Por ejemplo. 


A n B\ 



A\ 2 B 2 — 


0 -4 
3 -1 


-1 

5 


6 

-2 

-3 

3' 

2 






' 15 

12' 


2 

-5 





-20 -8 
-8 7 


Por lo tanto, el bloque superior es 


A\\B\ + A l2 B 2 


15 12 

2 -5 



-5 4 
-6 2 


La regla fila-columna para la multiplicación de matrices por bloques ofrece la manera 
más general de considerar un producto de dos matrices. Cada una de las siguientes formas 
de ver un producto ya se describió mediante particiones sencillas de matrices: 1. la defini¬ 
ción de Ax usando las columnas de A, 2. la definición de columna de AB, 3. la regla fila- 
columna para calcular AB, y 4. las filas de AB como productos de las filas de A y la matriz 
B. Una quinta manera de ver AB, usando de nuevo particiones, se presentará más adelante 
en el teorema 10. 

Los cálculos del siguiente ejemplo preparan el camino para el teorema 10. Aquí, col¿.(A) 
es la £-ésima columna de A, y la fila¿. (B) es la £-ésima fila de B. 
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EJEMPLO 4 


Sea A = 


1 

2" 


a 

b~ 

-4 

5 

y b = 

c 

e 

d 

f _ 


. Compruebe que 


AB = coli(A) filad#) + col 2 (A) fila 2 (#) + col 3 (A) fila 3 (B) 


SOLUCIÓN Cada uno de los términos anteriores es un producto externo. (Véase los ejerci¬ 
cios 27 y 28 de la sección 2.1). Por la regla fila-columna para calcular un producto matricial, 


coli(A) filad#) 
col 2 (A) fila 2 (#) 
col 3 (A) filad#) 


-3 

1 


1 

-4 


[a 

[c 


b] 

d ] 


—3a —3b 
a b 

c d 

—4c —Ad 



/] 


2e 2/ 

5e 5/ 


De modo que 


3 

col,(A) filad#) 

A —1 


—3 a —{— c* —j— 2c — 3b A~ d A~ 3. f 
a — 4c + 5e b — Ad + 5/ 


Es evidente que esta matriz es AB. Observe que la entrada (1, 1) de AB es la suma de las 
entradas (1, 1) de los tres productos externos, la entrada (1,2) en AB es la suma de las entra¬ 
das (1, 2) de los tres productos externos, y así sucesivamente. ■ 


TEOREMA 10 

Expansión columna-fila de AB 

Si A es de m x n y B es de n x p, entonces 


' filad#)' 
fila 2 (#) 



AB = [col! (A) col 2 (A) 

••• col„(A)] 

. fila„0B). 

(1) 


= col!(A) filaba) + •• 

■ • + col„(A) fila„(5) 



DEMOSTRACIÓN Para cada índice de fila i e índice columna j, la entrada (i, j) en col,(A) 
fila,(#) es el producto de de col,(A) y bkj de fila,(#). Por lo tanto, la entrada (i,j) de la suma 
que se muestra en la ecuación (1) es 

a,\b\j + a ¡2 b 2 j + ••• + a in b nJ 
(A: = 1) (k = 2) (k = n ) 


Esta suma también es la entrada (i,/) de AB, por la regla fila-columna. 


Inversas de matrices particionadas 

El siguiente ejemplo ilustra los cálculos relacionados con inversas y matrices particionadas. 


EJEMPLO 5 Se dice que una matriz de la forma 


^11 A 12 
0 A 22 


es triangular superior por bloques. Suponga que An es de p x p, A 22 es de q x q, y A in¬ 
vertible. Encuentre una fórmula para A -1 . 
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SOLUCIÓN Denote A 1 con B, y efectúe una partición de B para que 


'An 

Ai 2 " 


B \2 


'Ip 

0 ' 

0 

A 22 _ 

B21 

B22 _ 


0 

h. 


Esta ecuación matricial proporciona cuatro ecuaciones que conducen a los bloques des¬ 
conocidos Bu,..., B>yi. Calcule el producto a la izquierda de (2), e iguale cada entrada con el 
bloque correspondiente en la matriz identidad a la derecha. Es decir, establezca 


A 11 .B 11 + A12B21 

= I P 

(3) 

A n#i2 + M2B22 

= 0 

(4) 

A22B21 

= 0 

(5) 

A22B22 

= h 

(6) 


Por sí misma, (6) no establece que A 22 sea invertible. Sin embargo, ya que A 22 es cuadrada, el 
teorema de la matriz invertible y (6), juntos, indican que A 22 es invertible y B 22 = A^, 1 . Ahora, 
al multiplicar por la izquierda ambos lados de (5) por Ap~, se obtiene 

B21 = A-JO = 0 

por lo que (3) se simplifica a 


A11.B11 + 0 — I p 

Ya que An es cuadrada, esto demuestra que An es invertible y Bu = A[ j 1 . Por último, usando 
estos resultados con la ecuación (4) se encuentra que 

A\\Bn = —A 12 B 22 = —AnAj, 1 y B \2 = — A ll 1 Ai 2 A 2 2 

Así, 



"A n 

A12" 

-i 

An' Ajj 1 AnAjj 1 1 


0 

A22 


7a 

0 


Una matriz diagonal por bloques es una matriz particionada con bloques cero fuera de 
la diagonal (de bloques) principal. Una matriz de este tipo es invertible si y solo si cada blo¬ 
que sobre la diagonal es invertible. Véase los ejercicios 13 y 14. 


- NOTAS NUMÉRICAS - 

1. Cuando las matrices son demasiado grandes para caber en la memoria de alta ve¬ 
locidad de una computadora, particionarlas permite trabajar solamente con dos o 
tres submatrices a la vez. Por ejemplo, un equipo de investigación de programa¬ 
ción lineal simplificó un problema al particionar la matriz en 837 filas y 51 co¬ 
lumnas. La solución del problema tardó aproximadamente cuatro minutos en una 
supercomputadora Cray. 1 

2. Algunas computadoras de alta velocidad, en particular aquellas con arquitectura 
de conducción vectorial, realizan cálculos matriciales con mayor eficiencia cuando 
los algoritmos usan matrices particionadas. 2 

3. Los programas de computadora profesionales para álgebra lineal numérica de alto 
desempeño, como LAPACK, utilizan de manera intensiva cálculos de matrices 
particionadas. 


1 El tiempo de solución no parece muy impresionante hasta saber que cada bloque de las 51 columnas contenía, 
aproximadamente, 250,000 columnas individuales. ¡El problema original tenía 837 ecuaciones y más de 12,750,000 
variables! Casi 100 millones de las más de 10 mil millones de entradas eran diferentes de cero. Véase Robert E. 
Bixby et al., “Very Large-Scale Linear Programming: A Case Study in Combining Interior Point and Simplex 
Methods”, Operations Research, 40, núm. 5 (1992): 885-897. 

2 La importancia de los algoritmos de matrices por bloques para cálculos de computadora se describe en Matrix 
Computations, 3a. ed., de Gene H. Golub y Charles F. van Loan (Baltimore: Johns Hopkins University Press, 1966). 
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Los siguientes ejercicios permiten obtener práctica con el álgebra matricial e ilustran los 
cálculos comunes que se encuentran en aplicaciones. 


PROBLEMAS DE PRACTICA 


1. Demuestre que 


/ 0 
A I 


es invertible y encuentre su inversa. 


2. Calcule X T X, donde X está particionada como [X¡ AS]. 


2.4 EJERCICIOS 


En los ejercicios 1 a 9, suponga que las matrices están particionadas 
de manera conformada para la multiplicación por bloques. Calcule 
los productos que se indican en los ejercicios 1 a 4. 


I 

0' 

'A 

B 

2 . 

' E 

°1 

' P 

Q~ 


E 

I 

C 

D 

0 

F \ 

R 

S 


0 

r 

'A 

B~ 

4. 

/ 

0' 

r w 

*1 

I 

0 

C 

D 

- E 

/ 

Y 

z 

■ 


En los ejercicios 5 a 8 . encuentre fórmulas paraX, Y y Z, en términos 
de A, B y C, y justifique sus cálculos. En algunos casos, tendrá que 
hacer suposiciones acerca del tamaño de una matriz para obtener una 
fórmula. [Sugerencia: Calcule el producto a la izquierda e iguálelo 
al lado derecho]. 


5. 

'A 

B 

" I 

0 " 


" 0 

r 


C 

0 

X 

Y 


z 

0 


6 . 

"X 

0 " 

'A 

0 ' 


" / 

0 ' 


Y 

z 

B 

c 

— 

0 

I 






'A 

Z~ 




7. 

"X 

0 

0 ' 

0 

0 


" I 

0 " 

— 

0 

Y 

0 

I 

B 


/ 





I 




8 . 

"A 

B 

"X 

Y 

z~ 


"/ 

0 

0 

I 

0 

0 

I 

= 

0 

0 


9. Suponga que Bu es una matriz invertible. Encuentre las ma¬ 
trices A 2 i y A 31 (en términos de los bloques de B) de tal mane¬ 
ra que el producto que aparece a continuación tenga la forma 
indicada. Además, calcule C 22 (en términos de los bloques de 
B). [Sugerencia: Calcule el producto a la izquierda e iguálelo al 
lado derecho]. 


/ 

0 

0 ' 

~B n 

Bu 


"C n 

Cu 

A 2 i 

1 

0 

B21 

B22 

= 

0 

C22 

_A 3 l 

0 

I 

_ B31 

B32 _ 


0 

C 32 _ 


10. La inversa de 


' I 

0 

0 ' 


■ / 

0 

0 ' 

A 

I 

0 

es 

p 

1 

0 

B 

D 

I 


,2 

R 

/ 


En los ejercicios 11 y 12, marque cada enunciado como verdadero o 
falso. Justifique sus respuestas. 


11. a) Si A = [Ai A 2 ] y 6 = [61 62 ], con Ai y A 2 de las mis¬ 
mas dimensiones que B\ y B 2 . respectivamente, entonces 
A + B = [A\ + B\ A 2 + B 2 ]. 


b) Si A = 


A n 


y B 


B 1 
B 2 


entonces las particio- 


_A 2 i A 22 _ 

nes de A y B están conformadas para la multiplicación por 
bloques. 

12. a) Si Ai, A->, B\ y Bi son matrices de n x n, A = 1 

L 

B — [Bi 6 2 ]. entonces el producto BA está definido, pero AB 
no lo está. 


b) Si A = 
A t = 


P 

R 

P T 

R T 


Q 

s 

Q T 

s T 


, entonces la transpuesta de A es 


13. Sea A = 


B 0 

0 c 


donde B y C son cuadradas. Demuestre 


que A es invertible si y solo si B y C son invertibles. 


14. Demuestre que el bloque de matriz triangular superior A en el 
ejemplo 5 es invertible si y solo si tanto An como A 22 son inver¬ 
tibles. [Sugerencia: Si An y A 2 2 son invertibles, la fórmula para 
A -1 , que se dio en el ejemplo 5, en realidad funciona como la 
inversa de A], Este hecho de A es una parte importante de varios 
algoritmos de computadora que estiman valores propios de ma¬ 
trices. Los valores propios se analizan en el capítulo 5. 


15. Cuando se lanza una sonda espacial, es necesario hacer algu¬ 
nas correcciones para colocar la nave en una trayectoria exacta. 
La radio telemetría proporciona un flujo de vectores, Xj,..., x¿, 
que arrojan información en diferentes momentos sobre cómo 
se compara la posición de la sonda con la trayectoria prevista. 
Sea X¿ la matriz [x¡ ••• x¿]. La matriz G¿ = X^XJ se calcula 
conforme se analizan los datos del radar. Cuando llega x¿+i, se 
debe calcular un nuevo Ga+i- Como los vectores de datos llegan 
a alta velocidad, la carga computacional podría ser grande. Pero 
la multiplicación de la matriz particionada ayuda muchísimo. 
Calcule las expansiones columna-fila de Ga y Ga+ 1 , y describa 
lo que se debe calcular para actualizar Ga a la forma Ga+i- 


Encuentre P, Q y R. 
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La sonda Galileo fue lanzada el 18 de octubre 
de 1989 y llegó cerca de Júpiter a principios de 
diciembre de 1995. 


19. Suponga que A — sl„ es invertible y considere la ecuación (8) 
como un sistema de dos ecuaciones matriciales. Resuelva la 
ecuación superior para x y sustitúyala en la ecuación inferior. 
El resultado es una ecuación de la forma VL(.s)u = y, donde 1 V(í) 
es una matriz que depende de s. VL(í) se denomina función de 
transferencia del sistema porque transforma la entrada u en la 
salida y. Encuentre W(s) y describa cómo está relacionada con 
el sistema de matriz particionada del miembro izquierdo de (8). 
Véase el ejercicio 16. 

20. Suponga que la función de transferencia VL(i) del ejercicio 19 
es invertible para alguna s. Es posible demostrar que la fun¬ 
ción de transferencia inversa VL(s)~"\ que transforma salidas en 
entradas, es el complemento de Schur de A — BC — sl„ para 
la matriz que se presenta a continuación. Encuentre este com¬ 
plemento de Schur. Véase el ejercicio 16. 

A — BC — sl„ B 
-C l m 


Sea A = 


i Ai i es invertible, entonces la matriz 


S = A 2 2 — A 2 |Ajj'A 12 se llama complemento de Schur de An- 
Por otra parte, si A 22 es invertible, la matriz Au — A 12 A ¡¡Ají se 
llama complemento de Schur de A 22 - Suponga que Au es in¬ 
vertible. Encuentre X y Y tal que 

~a u a ¡2 ] = r / oír Au oír / y i 

a 2 i a 22 j L z 1 \l 0 sJL° 1 \ 


17. Suponga que la matriz por bloques A del lado izquierdo de (7) 
y Au son invertibles. Demuestre que el complemento de Schur 
S de An es invertible. [Sugerencia: Los factores externos lo¬ 
calizados en el lado derecho de (7) siempre son invertibles. 
Compruebe esto]. Cuando A y Au son ambas invertibles, (7) 
conduce a una fórmula para A -1 , utilizando S _1 , A jj 1 y las otras 
entradas de A. 

18. Sea X una matriz de datos de m x n tal que X T X es invertible, y 
sea M = I m — X(X T X) 1 X T . Añada una columna xo a los datos 
y forme 

W=[X xo]. 

Calcule W T W. La entrada (1, 1) es X T X. Demuestre que el com¬ 
plemento de Schur (ejercicio 16) de X T X se puede escribir en la 
forma x^ Mxq. Es posible demostrar que la cantidad (xfi Mx o) -1 
es la entrada (2, 2) de {W'W) *. Esta entrada tiene una interpre¬ 
tación estadística útil, a la luz de las hipótesis adecuadas. 

En el estudio de ingeniería de control de sistemas físicos, un con¬ 
junto estándar de ecuaciones diferenciales se transforma en el si¬ 
guiente sistema de ecuaciones lineales por medio de transformadas 
de Laplace: 

' A — sl n B ITxl = T Oí 

C /„, J L«J L y J ’ 

donde A es de n x n, B es de n xm,C es de m xn.yj es una variable. 
El vector u en IR"' es la “entrada” del sistema, y en IR"' es la “salida” 
del sistema, y x en IR" es el vector de “estado”. (En realidad, los 
vectores x, u y y son funciones de ,s, pero esto no afecta los cálculos 
algebraicos de los ejercicios 19 y 20). 


21. a) Compruebe que A 2 = I cuando A = 

b ) Use matrices particionadas para demostrar que M 2 = I 
cuando 




22. Generalice la idea del ejercicio 21 al construir una matriz M 

'A 0 0 ' 

de 6 x 6 , M = 0 B 0 tal que M 2 = 1. Haga a C 

C 0 D_ 

una matriz de 2 x 2 no nula. Muestre que su construcción 
funciona. 

23. Use matrices particionadas para demostrar, por inducción, que 
el producto de dos matrices triangulares inferiores también 
es triangular inferior. [Sugerencia: Una matriz A¡ de (k + 1) x 
(k + 1) se puede escribir en la forma presentada a continua¬ 
ción, donde a es un escalar, v está en IR A , y A es una matriz trian¬ 
gular inferior de k x k. [Véase la Guía de estudio para obtener 
ayuda con la inducción]. 



24. Use matrices particionadas para demostrar por inducción que 
para n = 2, 3,..., la matriz A de n x n que se presenta a conti¬ 
nuación es invertible y que B es su inversa. 
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Para el paso de inducción, suponga que Ay B son matrices de 
(k + 1) x (k + 1), y particione A y B de una manera similar a 
la que se presenta en el ejercicio 23. 


c) Construya una matriz de 50 x 50 de la forma 



0 

A T 


[Nota: Tal vez no sea necesario especi- 


25. Sin utilizar reducción por filas, encuentre la inversa de 



' 1 

2 

0 

0 

0 ' 


3 

5 

0 

0 

0 

A = 

0 

0 

2 

0 

0 


0 

0 

0 

7 

8 


0 

0 

0 

5 

6 


26. [M] Para las operaciones de bloque, podría ser necesario intro¬ 
ducir o recurrir a submatrices de una matriz grande. Describa 
las funciones o los comandos de un programa de matrices que 
realice las siguientes tareas. Suponga que A es una matriz de 
20 x 30. 

a ) Presente la submatriz de A de las filas 5 a 10 y de las colum¬ 
nas 15 a 20. 

b ) Inserte una matriz B de 5 x 10 en una matriz A, comenzando 
en la fila 5 y la columna 10. 


ficar los bloques de ceros en C]. 

27. [M] Suponga que debido a restricciones de memoria o al tama¬ 
ño su programa de matrices no puede trabajar con matrices de 
más de 32 filas y 32 columnas, y suponga que algún proyecto 
requiere las matrices A y B de 50 x 50. Describa los comandos 
o las operaciones de su programa para matrices que realizan las 
siguientes tareas. 

a) Cálculo de A + B. 

b) Cálculo de AB. 

c) Resolución de Ax = b para algún vector b en IR 50 , supo¬ 
niendo que A se pueda particionar en una matriz por blo¬ 
ques de 2 x 2 [Ay], con Ai i una matriz invertible de 20 x 20, 
A 22 una matriz invertible de 30 x 30, y A 12 una matriz cero. 
[Sugerencia: Describa sistemas adecuados más pequeños 
que puedan resolverse sin usar matrices inversas]. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1 . 



0 

I 


es invertible, su inversa tiene la forma 


W 

Y 


X 

Z 


. Compruebe que 


' / 0" 

~w 

X ' 


w 

X 

A I 

Y 

z 


AW + Y 

AX + Z 


Así, W, X, Y, Z deben satisfacer W = I,X = 0, AW + Y = 0, y AX + Z = I. Como con¬ 
secuencia, Y = —A y Z = I. Por lo tanto. 


' I 

0" 

I 

0' 


'/ 

0" 

A 

/ 

-A 

I 


0 

I 


El producto en el orden inverso también es la identidad, de modo que la matriz de bloque 

0 ]. (También podría recurrir al teorema de la matriz 


es invertible, y su inversa es 
invertible). 


—A I 


2. X‘X 


*1 

x¡ 


[a, x 2 \ 


xj X\ xj x 2 


x'x, 


. Las particiones de X T y X se con¬ 


forman de manera automática para la multiplicación por bloques, ya que las columnas de 
X T son las filas de X. Esta partición de X T X se usa en varios algoritmos de computadora 
para cálculos de matrices. 


2.5 


FACTORIZACIONES DE MATRICES 


Una factorización de una matriz A es una ecuación que expresa a A como un producto de 
dos o más matrices. Mientras que la multiplicación de matrices implica una síntesis de da¬ 
tos (combinando el efecto de dos o más transformaciones lineales en una sola matriz), la 
factorización de matrices es un análisis de datos. En el lenguaje de la ciencia computacio- 
nal, la expresión de A como un producto equivale a un procesamiento previo de los datos de 
A, organizando esos datos en dos o más partes cuyas estructuras son más útiles de algún 
modo, quizá por ser más accesibles para realizar cálculos. 
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Las factorizaciones de matrices y, después, las factorizaciones de transformaciones linea¬ 
les se presentarán en un gran número de secciones clave a lo largo de este libro. Esta sección 
se enfoca en una factorización que constituye el centro neurálgico de varios importantes pro¬ 
gramas de cómputo usados ampliamente en aplicaciones, como en el problema de la aeronave 
descrito en la introducción del capítulo. Algunas otras factorizaciones que se estudiarán des¬ 
pués, se presentan en los ejercicios. 


La factorización LU 

La factorización LU, descrita a continuación, está motivada por el muy frecuente problema 
industrial y de negocios que consiste en resolver una sucesión de ecuaciones, todas con la 
misma matriz de coeficientes: 


Ax = bi, Ax = bi, ..., Ax = b,, (1) 

Véase el ejercicio 32, por ejemplo. También vea la sección 5.8, donde se usa el método de la 
potencia inversa para estimar los valores propios de una matriz resolviendo una secuencia de 
ecuaciones, como en (1), una a la vez. 

Cuando A es invertible, se podría calcular A -1 y después calcular A 1 bi, A 'bi, y así 
sucesivamente. Sin embargo, resulta más eficiente resolver la primera ecuación en la se¬ 
cuencia (1) con reducción por filas y obtener una factorización LU de A al mismo tiempo. 
Después, las ecuaciones restantes de (1) se resuelven con la factorización LU. 

Primero, suponga que A es una matriz de m x n que se puede reducir por filas a su for¬ 
ma escalonada sin intercambios de fila. (Más adelante, se tratará el caso general). Entonces, 
A se puede escribir en la forma A = LU, donde L es una matriz triangular inferior de m x m 
con números 1 en la diagonal, y U es una forma escalonada de m x n de A. Por ejemplo, 
véase la figura 1. Una factorización de este tipo se llama factorización LU de A. La matriz 
L es invertible y se llama matriz triangular inferior unitaria. 


~1 

0 

0 

0 ' 


■ 

* 

* 

* 

*" 

* 

1 

0 

0 
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■ 

* 

* 

* 

* 

* 

1 
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0 

0 

0 

■ 

* 

* 

* 

* 
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0 

0 

0 

0 

0 _ 


L U 


FIGURA 1 Una factorización LU. 


Antes de estudiar la forma de construir L y U, es necesario examinar la razón de su uti¬ 
lidad. Cuando A = LU, la ecuación Ax = b se escribe como L(Ux ) = b. Escribiendo y 
en lugar de Ux, se puede encontrar x resolviendo el par de ecuaciones 


Ly = b 

Ux = y 


( 2 ) 


Primero se despeja y de Ly = b, y luego se resuelve Ux = y para obtener x. Véase la figura 2. 
Las dos ecuaciones resultan fáciles de resolver porque Ly U son triangulares. 


EJEMPLO 1 Es posible comprobar que 


3 

-7 

-2 

2' 


1 

0 

0 

0~ 


'3 

-7 

-2 

2 

-3 

5 

1 

0 


-1 

1 

0 

0 


0 

-2 

-1 

2 

6 

-4 

0 

-5 


2 

-5 

1 

0 


0 

0 

-1 

1 

-9 

5 

-5 

12 


-3 

8 

3 

1 


0 

0 

0 

-1 


= LU 
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Multiplicación 



FIGURA 2 Factorización del mapeo x i-> Ax. 


Use esta factorización LU de A para resolver Ax = b, donde b = 


-9 

5 

7 

11 


SOLUCIÓN La solución de Ly = b requiere únicamente de 6 multiplicaciones y 6 sumas, 
porque la aritmética ocurre solo en la columna 5. (En L, los ceros debajo de cada pivote se 
crean automáticamente con la elección de las operaciones de fila). 


1 

0 

0 

0 

-9" 


" 1 

0 

0 

0 

-9" 

-1 

1 

0 

0 

5 


0 

1 

0 

0 

-4 

2 

-5 

1 

0 

7 


0 

0 

1 

0 

5 

-3 

8 

3 

1 

11 


0 

0 

0 

1 
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Entonces, para Ux = y, la fase “regresiva” de la reducción por filas requiere de 4 divi¬ 
siones, 6 multiplicaciones y 6 sumas. (Por ejemplo, para producir ceros en la columna 4 de 
[U y] se requieren una división en la fila 4 y tres pares de multiplicación-suma para sumar 
múltiplos de la fila 4 a las filas de arriba). 


"3 

-7 

-2 

2 

-9 


" 1 

0 

0 

0 

3 


3" 

0 

-2 

-1 

2 

-4 


0 

1 

0 

0 

4 


4 

0 

0 

-1 

1 

5 


0 

0 

1 

0 

-6 

, X = 

-6 

0 

0 

0 

-1 

1 
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0 

0 

1 

-1 


-1 


Para encontrar x se requieren 28 operaciones aritméticas o “flops” (operaciones de pun¬ 
to flotante), excluyendo el costo de encontrar L y U. En contraste, la reducción por filas de 
[A b] a [/ x] requiere de 62 operaciones. ■ 

La eficiencia computacional de la factorización LU depende de que se conozcan L 
y U. El siguiente algoritmo muestra que la reducción por filas de A a su forma escalonada 
U equivale a una factorización LU, porque produce L prácticamente sin trabajo extra. Des¬ 
pués de la primera reducción por filas, L y U se obtienen al resolver ecuaciones adicionales 
cuya matriz de coeficientes es A. 


Un algoritmo de factorización LU 

Suponga que A se puede reducir a una forma escalonada U utilizando solo remplazos de filas 
que suman un múltiplo de una fila a otra situada debajo de esta. En este caso, existen matrices 
elementales triangulares inferiores unitarias E\,..., E p tales que 

E p ■■■ E\A = U (3) 


Luego, 

A = (E p ••• E 1 r 1 U = LU 


donde 


L=(E p -E l )~ 


1 


(4) 
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Es posible demostrar que los productos y las inversas de las matrices triangulares inferiores 
unitarias también son triangulares inferiores unitarias. (Por ejemplo, véase el ejercicio 19). 
Así, L es triangular inferior unitaria. 

Observe que las operaciones de fila en la ecuación (3), que reducen A a U, también re¬ 
ducen la L en la ecuación (4) a I, debido a que E p ■■■ E\L = (E p ■■■ E\)(E p ¿j) 1 = /. Esta 
observación es la clave para construir L. 


ALGORITMO PARA UNA FACTORIZACIÓN LU 

1. Si es posible, reduzca A a una forma escalonada U con una sucesión de operaciones 
de remplazo de filas. 

2. Coloque las entradas de L de tal manera que la misma secuencia de operaciones de 
fila reduzca La/. 


El paso 1 no siempre es posible, pero cuando lo es, el argumento anterior indica que 
existe una factorización LU. En el ejemplo 2 se mostrará cómo implementar el paso 2. Por 
construcción, L satisfará 


{E p ■■■ E\)L = I 

donde se usan las mismas E\,..., E p que en la ecuación (3). Así, L será invertible, de acuerdo 
con el teorema de la matriz invertible, con ( E p ■■■ L)) = L 1 . A partir de (3), L ',4 = U, y 
A = LU. Por lo tanto, el paso 2 producirá una L aceptable. 


EJEMPLO 2 Encuentre una factorización LU de 

"2 4-1 5-2 

-4-5 3-8 1 

A ~~ 2-5-4 1 8 

-6 0 7 -3 1 


SOLUCION Como A tiene cuatro filas, L debe ser de 4 x 4. La primera columna de L es la 
primera columna de A dividida entre la entrada pivote superior: 

" 1 0 0 0 " 

-2 1 0 0 

L ~ 1 10 
-3 1 


Compare las primeras columnas de A y L. Las operaciones de fila que crearon ceros en la 
primera columna de A también crearán ceros en la primera columna de L. Para lograr que 
esta misma correspondencia de operaciones de fila sea válida para el resto de L, se examina 
una reducción por filas de A a una forma escalonada U. Es decir, se resaltan las entradas en 
cada una de las matrices que se utilizan para determinar la secuencia de las operaciones de 
fila que transforman A en U. [Véase las entradas resaltadas en la ecuación (5)]. 
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4 

-1 

5 ■ 
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4 
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4 2 = 

0 

0 

0 

1 
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0 

0 

0 
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0 

0 

0 

4 
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0 

0 

0 
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= A, 


(5) 


= U 





2.5 Factorizaciones de matrices 127 


Las entradas resaltadas de la ecuación (5) determinan la reducción por filas de A a U. En cada 
columna pivote, divida las entradas resaltadas entre el pivote y coloque el resultado en L: 


2 



-4 


3 ~ 
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-9 


-6 


12 
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42 43 4-2 45 
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1 
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0 
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-2 
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0 

0 

1 

-3 
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II 

-J 

1 

-3 

1 

0 

-3 

4 

2 

1 


-3 

4 

2 

1 


Un cálculo fácil comprueba que estas L y U satisfacen que LU = A. ■ 


En el trabajo práctico, casi siempre son necesarios los intercambios de fila, porque se usa 
el pivoteo parcial para lograr una precisión alta. (Recuerde que este procedimiento selecciona, 
entre las posibles opciones de pivote, una entrada en la columna que tenga el mayor valor ab¬ 
soluto). Para manejar los intercambios de fila, la factorización LU anterior se puede modificar 
con facilidad para producir una L que sea triangular inferior permutada, en el sentido de que 
un reordenamiento (llamado permutación) de las filas de L puede hacer que L sea triangular 
inferior (unitaria). La factorización LU permutada resultante resuelve Ax = b en la misma 
forma que antes, excepto que la reducción de [L b] a [/ y] es consecuencia del orden de 
los pivotes de L de izquierda a derecha, empezando con el pivote de la primera columna. Una 
referencia a una “factorización LU” normalmente incluye la posibilidad de que L pueda ser 
triangular inferior permutada. Para mayores detalles, véase la Guía de estudio. 


- NOTAS NUMÉRICAS - 

Los siguientes conteos de operaciones corresponden a una matriz densa A de n x n 

(con la mayoría de sus entradas distintas de cero), donde ti es moderadamente grande, 

por ejemplo, n > 30. 1 

1. El cálculo de una factorización LU de A requiere 2« 3 /3 flops (aproximadamente lo 
mismo que reducir por filas [A b]), mientras que encontrar ,4 1 requiere alrededor 
de 2rf flops. 

2. Resolver Ly = b y Ux = y requiere alrededor de 2 n 2 flops, ya que cualquier sis¬ 
tema triangular n x n se puede resolver en aproximadamente n 2 flops. 

3. La multiplicación de b por A -1 también requiere cerca de 2 rr flops, pero el resul¬ 
tado quizá no sea tan preciso como el obtenido a partir de Ly U (debido al error 
de redondeo cuando se calculan tanto a A -1 como a A - 1 b). 

4. Si A es dispersa (la mayoría de sus entradas son cero), entonces Ly U podrían ser 
dispersas también, pero es probable que A -1 sea densa. En este caso, una solución 
de Ax = b con una factorización LU es mucho más rápida que usar A -1 . Véase el 
ejercicio 31. 


Factorización de matrices en ingeniería eléctrica 

La factorización de matrices está íntimamente relacionada con el problema de construir una 
red eléctrica de propiedades específicas. El análisis que se presenta a continuación permite 
vislumbrar la relación entre factorización y diseño de circuitos. 


1 Véase la sección 3.8 de Applied Linear Algebra, 3a. ed., de Ben Noble y James W. Daniel (Englewood Cliffs, NJ: 
Prentice-Hall, 1988). Recuerde que para nuestros propósitos, un flop es +, —, x o 4 
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Suponga que el cuadro de la figura 3 representa algún tipo de circuito eléctrico, con una 


entrada y una salida. El voltaje y la corriente de entrada se registran mediante 


vi 

h 


(con el 


voltaje v en volts y la corriente i en amperes), y el voltaje y la corriente de salida se registran 

v 2 
i 2 


como 


. Con frecuencia, la transformación 


Vi 


1 

<N 

* 

1_ 

h-> 

_ l'l _ 


L *2j 


es lineal. Es decir, existe una 


matriz A, que se llama matriz de transferencia, tal que 


v 2 

h 


= A 


vi 

h 


terminales 
de entrada 


circuito 

eléctrico 


terminales 
de salida 


FIGURA 3 Un circuito con terminales de entrada 
y salida. 


En la figura 4 se muestra una red en escalera, donde dos circuitos (podría haber más) 
están conectados en serie, de modo que la salida de un circuito sea la entrada del siguiente 
circuito. El circuito de la izquierda en la figura 4 es un circuito en serie, con resistencia R¡ 
(en ohms). 


‘1 


l 2 l 2 



3 

V 1 

'*1 

V 2 

i 

< 

< 

r- 

V 3 








Un circuito en serie Un circuito con derivación 


FIGURA 4 Una red en escalera. 


El circuito de la derecha en la figura 4 es un circuito con derivación, con resistencia R 2 . Con 
base en la ley de Ohm y las leyes de Kirchhoff, es posible demostrar que las matrices de trans¬ 
ferencia de los circuitos en serie y con derivación, respectivamente, son, 


1 R\ 

0 1 . 

Matriz de transferencia 
del circuito en serie 


1 0 



Matriz de transferencia 
del circuito con derivación 


EJEMPLO 3 

a) Calcule la matriz de transferencia para la red en escalera de la figura 4. 

T 1-8' 

b) Diseñe una red en escalera cuya matriz es I - . 


SOLUCIÓN 

a) Sean Ai y A 2 las matrices de transferencia de los circuitos en serie y con derivación, res¬ 
pectivamente. Entonces, un vector de entrada x se transforma primero en A¡x y luego en 
A 2 (Aix). La conexión en serie de los circuitos corresponde a la composición de transfor¬ 
maciones lineales, y la matriz de transferencia de la red en escalera es (observe el orden) 


1 

0' 

■i -*r 


1 

-Ri 

_-l/R 2 

1 

0 1 


_-l/R 2 

1 + Ri/R 2 _ 


A 2 Ai = 


( 6 ) 
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b) Para factorizar la matriz 




en el producto de matrices de transferencia, como 


en la ecuación (6), se buscan las R\ y /U de la figura 4 que satisfagan 


1 

-Ri 


1-8' 

-l/Rl 

1 + Ri/R 2 _ 


-.5 5 


De las entradas (1, 2), se tiene que R\ = 8 ohms, y de las entradas (2, 1), I /AS = .5 ohm 
y R 2 = 1/.5 = 2 ohms. Con estos valores, la red de la figura 4 tiene la matriz de trans¬ 
ferencia deseada. ■ 

Una matriz de transferencia de red resume el comportamiento de entrada y salida (las 
especificaciones de diseño) de la red, sin referencia a los circuitos internos. Para construir fí¬ 
sicamente una red con propiedades específicas, un ingeniero determina al principio si es posi¬ 
ble construir (o realizar) dicha red. Después, trata de factorizar la matriz de transferencia para 
obtener matrices correspondientes a circuitos más pequeños que quizá ya fueron fabricados y 
estén listos para ensamblarse. En el caso común de la corriente alterna, las entradas de la ma¬ 
triz de transferencia normalmente son funciones con valores complejos. (Véase los ejercicios 
19 y 20 de la sección 2.4 y el ejemplo 2 de la sección 3.3). Un problema estándar consiste en 
encontrar una realización mínima que use el menor número de componentes eléctricos. 


PROBLEMA DE PRÁCTICA 


Encuentre una factorización LU de A = 



. [Nota: Resultará que A 


tiene solamente tres columnas pivote, de manera que el método del ejemplo 2 solo produce 
las tres primeras columnas de L. Las dos columnas restantes de L provienen de I¡], 


2.5 EJERCICIOS 


En los ejercicios 

1 a 6, 

resuelva la ecuación Ax = b usando la fac- 
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0 

0' 

' r 2 

-4 

2 


torización LU dada para A. En los ejercicios 1 y 2, resuelva también 


A = 

-2 
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0 

0 

-3 
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Ax — b por reducción ordinaria de columnas. 
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22. (Factorización LU reducida). Con A como en el problema 
de práctica, encuentre una matriz B de 5 x 3 y una matriz C de 
3x4 tales que A = BC. Generalice esta idea para el caso donde 
A es m x n, A = LU, y U tiene solamente tres filas diferentes 
de cero. 

23. (Factorización de rango). Suponga que una matriz A de m x n 
admite una factorización A = CD, donde C es de m x 4 y D es 
de 4 x n. 


Encuentre una factorización LU de las matrices de los ejercicios 7 a 
16 (con L triangular inferior unitaria). Observe que MATLAB gene¬ 
ralmente producirá una factorización LU permutada porque utiliza 
pivoteo parcial para lograr exactitud numérica. 



3 7 2] [232' 

11. 6 19 4 12. 4 13 9 

-3 -2 3j [-6 5 4_ 



a) Demuestre que A es la suma de cuatro productos exteriores. 
(Véase la sección 2.4). 

b ) Sea m = 400 y n = 100. Explique por qué un programador 
de computadoras preferiría almacenar los datos de A en for¬ 
ma de dos matrices C y D. 


24. (Factorización QR). Suponga que A = QR, donde Q y R son 
n x n, R es invertible y triangular superior, y Q tiene la pro¬ 
piedad de que Q T Q = I. Demuestre que para cada b en IR", la 
ecuación Ax = b tiene una solución única. ¿Qué cálculos con 
Q y R producirán la solución? 



25. (Descomposición en valores singulares). Suponga que A = 
UDV t , donde U y V son matrices de n x n con la propiedad de 
que U T U = I y V T V = I, y donde D es una matriz diagonal con 
números positivos o-],..., cr„ en la diagonal. Demuestre que A es 
invertible y encuentre una fórmula para A -1 . 


[2-3 41 


2 

0 

5 

2 "I -4 

8 

-7 

15. —6 

3 

-13 

-3 16. 6 

-5 

14 

4 

9 

16 

1 

ON 

9 

-12 




L 8 

-6 

19 


17. Cuando A es invertible, MATLAB encuentra A -1 al factorizar 
A = LU (donde L puede ser triangular inferior permutada), in¬ 
virtiendo L y U, y luego calculando U~ l L~ l . Use este método 
para calcular la inversa de A en el ejercicio 2 . (Aplique el algo¬ 
ritmo de la sección 2.2 a L y a U). 

18. Encuentre A~ 1 como en el ejercicio 17, usando A del ejercicio 3. 

19. Sea A una matriz de n x n triangular inferior con entradas di¬ 
ferentes de cero en la diagonal. Demuestre que A es invertible 
y A -1 es triangular inferior. [Sugerencia: Explique por qué A 
puede convertirse en I usando solo remplazos de filas y esca¬ 
lamientos. (¿Dónde están los pivotes?). También, explique por 
qué las operaciones de fila que reducen A a / transforman a I 
en una matriz triangular inferior], 

20. Sea A = LU una factorización LU. Explique por qué A se puede 
reducir por filas a U utilizando solamente operaciones de rem¬ 
plazo. (Este hecho es el recíproco de lo que se demostró en el 
libro). 

21. Suponga que A = BC, donde B es invertible. Demuestre que 
cualquier sucesión de operaciones de fila que reduzca Bal tam¬ 
bién reduce A a C. Lo contrario no es cierto, puesto que la ma¬ 
triz cero puede factorizarse como 0 = B ■ 0. 

Los ejercicios 22 a 26 ofrecen una visualización de ciertas factori- 

zaciones de matriz ampliamente utilizadas, algunas de las cuales se 

analizan posteriormente en el libro. 


26. (Factorización espectral). Suponga que una matriz A de 3 x 3 
admite una factorización como A = PDF 1 , donde P es alguna 
matriz invertible de 3 x 3, y D es la matriz diagonal 



Muestre que esta factorización es útil cuando se calculan po¬ 
tencias grandes de A. Encuentre fórmulas relativamente senci¬ 
llas para A 2 . A 3 y A k (k es un entero positivo), usando P y las 
entradas en D. 


27. Diseñe dos redes en escalera diferentes con salida de 9 volts y 
4 amperes cuando la entrada sea de 12 volts y 6 amperes. 

28. Demuestre que si tres circuitos con derivación (cuyas resisten¬ 
cias son R\, R 2 , R 3 ) se conectan en serie, la red resultante tiene 
la misma matriz de transferencia que un único circuito con de¬ 
rivación. Encuentre una fórmula para la resistencia que haya en 
ese circuito. 


29. a) Encuentre la matriz de transferencia de la red que se ilustra 
en la figura. 



cuya matriz de transferencia sea A, encontrando una factori¬ 
zación matricial adecuada de A. 
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30. Encuentre una factorización diferente de la matriz de transfe¬ 
rencia A del ejercicio 29 y, a partir de ello, diseñe una red en 
escalera diferente cuya matriz de transferencia sea A. 

31. [M] Considere la placa térmica en la siguiente figura (consulte 
el ejercicio 33 en la sección 1.1). 



20 ° 

20 ° 


10 ° 10 ° 10 ° 10 ° 


La solución al problema de flujo de calor en estado estable para la 
placa de la figura se aproxima al resolver la ecuación Ax = b, 
donde b = (5, 15, 0, 10. 0, 10, 20, 30) y 
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| WEB | 

Las entradas faltantes en A son ceros. Las entradas de A dife¬ 
rentes de cero se encuentran dentro de una banda a lo largo de 
la diagonal principal. Tales matrices ele banda se presentan en 
diversas aplicaciones, y con frecuencia son extremadamente 
grandes (con miles de filas y columnas, pero con bandas relati¬ 
vamente angostas). 

a) Utilice el método del ejemplo 2 para construir una factori¬ 
zación LU de A, y observe que ambos factores son matrices 
de banda (con dos diagonales diferentes de cero abajo o arri¬ 
ba de la diagonal principal). Calcule LU — A para compro¬ 
bar su trabajo. 


b) Use la factorización LU para resolver Ax = b. 

c) Obtenga A -1 y observe que A -1 es una matriz densa sin 
estructura de banda. Cuando A es grande, L y Í7 se pueden 
almacenar en mucho menos espacio que A -1 . Este hecho 
es otra razón para preferir la factorización LU de A en lu¬ 
gar de A~*. 

32. [M] La matriz de banda A que se ilustra a continuación pue¬ 
de servir para calcular la conducción inestable de calor en una 
varilla para la cual las temperaturas en los puntos pn 

cambian con el tiempo. 2 

Ax Ax Ax Ax Ax 

n ' "" 1 .. '") 

Pi Pi Pt, Pa 


La constante C de la matriz depende de la naturaleza física de la 
varilla, de la distancia Ax entre los puntos de la varilla, y del 
tiempo A t que transcurre entre mediciones sucesivas de tem¬ 
peratura. Suponga que para k = 0,1, 2,..., un vector t* en IR 4 
lista las temperaturas en el tiempo kAt. Si ambos extremos de la 
varilla se mantienen a 0 o , entonces los vectores de temperatura 
satisfacen la ecuación Afi+i = L (k = 0, 1,...), donde 


(1 + 2C) -C 

-C (1 + 2C) -C 

-C (1 + 2C) -C 

-C (1 + 2C) 


a) Encuentre la factorización LU de A cuando C = 1. Una ma¬ 
triz como A con tres diagonales diferentes de cero se deno¬ 
mina matriz tridiagonal. Los factores L y U son matrices 
bidiagonales. 

b) Suponga que C=lyto = (10, 15,15, 10) r . Use la factori¬ 
zación LU de A para encontrar las distribuciones de tempe¬ 
ratura ti, Í 2 , tj y U. 


2 Véase Biswa N. Datta, Numerical Linear Algebra and Applications (Pacific 
Grove, CA: Brooks/Cole. 1994), pp. 200-201. 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


2 -4 

-2 

3 


"2 

-4 -2 

3" 

6 -9 

-5 

8 


0 

3 1 

-1 

2 -7 

-3 

9 

~ 

0 

-3 -1 

6 

4 -2 

-2 

-1 


0 

6 2 

-7 

-6 3 

3 

4 


0 

-9 -3 

13 


2 

-4 

-2 

3" 


"2 

-4 

-2 

3" 

0 

3 

1 

-1 


0 

3 

1 

-1 

0 

0 

0 

5 

~ 

0 

0 

0 

5 

0 

0 

0 

-5 


0 

0 

0 

0 

0 

0 

0 

10 


0 

0 

0 

0 


Divida las entradas de cada columna resaltada por el pivote en la parte superior. Las co¬ 
lumnas resultantes forman las tres primeras columnas de la mitad inferior de L. Esto basta 
para hacer que la reducción por filas de L a / corresponda a la reducción de A a U. Use las dos 
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últimas columnas de I¡ para hacer que L sea triangular inferior unitaria. 
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2.6 EL MODELO DE LEONTIEF DE ENTRADA Y SALIDA 


WEB 


El álgebra lineal desempeñó un papel fundamental en el trabajo de Wassily Leontief gana¬ 
dor del Premio Nobel, como se mencionó al principio del capítulo 1. El modelo económico 
descrito en esta sección es la base de modelos más complejos usados en muchas partes del 
mundo. 

Suponga que la economía de una nación se divide en n sectores que producen bienes o 
servicios, y sea x un vector de producción en IR" que lista la producción de cada sector en un 
año. También, suponga que otra parte de la economía (que se llama sector abierto) no produce 
bienes ni servicios, sino que solamente los consume, y sea d un vector de demanda final (o 
cuenta de demandas finales) que lista los valores de los bienes y servicios demandados a los 
diversos sectores por la parte no productiva de la economía. El vector d puede representar la 
demanda del consumidor, el consumo del gobierno, el superávit de producción, las exporta¬ 
ciones u otras demandas externas. 

Conforme los diversos sectores elaboran bienes para satisfacer la demanda del consumi¬ 
dor, los productores crean por sí mismos una demanda intermedia adicional de bienes que 
necesitan como insumos para su propia producción. Las interrelaciones de los sectores son 
muy complejas, y la conexión entre la demanda final y la producción es poco clara. Leontief 
se preguntó si hay un nivel de producción x tal que las cantidades producidas (o “suministra¬ 
das”) equilibran exactamente la demanda total de esa producción, de modo que 


cantidad j 


[ demanda | 


í demanda j 

producida 

X 


intermedia 

Í + | 

final 

1 d J 


La suposición básica del modelo de Leontief de entrada y salida es que, para cada sector, 
hay un vector de consumo unitario en IR" que lista los insumos necesarios por unidad de 
producción del sector. Todas las unidades de entrada y salida se miden en millones de dóla¬ 
res, y no en cantidades como toneladas o fanegas. (Los precios de los bienes y servicios se 
mantienen constantes). 

Como un ejemplo sencillo, suponga que la economía consiste en tres sectores —manu¬ 
factura, agricultura y servicios—, con los vectores unitarios de consumo Ci, C 2 y C 3 que se 
muestran en la siguiente tabla. 
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Insumos consumidos por unidad de producción 


Comprados por: 

Manufactura 

Agricultura 

Servicios 

Manufactura 

.50 

.40 

.20 

Agricultura 

.20 

.30 

.10 

Servicios 

.10 

.10 

.30 


t 

t 

t 


Cl 

C2 

C3 


EJEMPLO 1 ¿Qué cantidades consumirá el sector de manufactura si decide producir 100 
unidades? 

SOLUCIÓN Calcule 



".50 


"50" 

100ci = 100 

.20 

= 

20 


.10 


10 


Para producir 100 unidades, manufactura ordenará (es decir, “demandará”) y consumirá 50 
unidades de otras partes del sector de manufactura, 20 unidades de agricultura y 10 unidades 
de servicios. ■ 


Si manufactura decide producir x\ unidades, entonces x ¡ c \ representa las demandas in¬ 
termedias de manufactura, porque las cantidades de x i c i se consumirán en el proceso de crea¬ 
ción de las x\ unidades de producción. De la misma forma, si x-i y xy denotan las producciones 
planeadas de los sectores de agricultura y servicios, X2C2 y X3C3, listan las demandas interme¬ 
dias correspondientes. La demanda intermedia total de los tres sectores está dada por 


{demanda intermedia} = xitq + X2C2 + X3C3 
= Cx 

donde C es la matriz de consumo [ci C2 C3], a saber, 


.50 

.40 

.20 

.20 

.30 

.10 

.10 

.10 

.30 


( 2 ) 


( 3 ) 


Las ecuaciones (1) y (2) producen el modelo de Leontief. 


EL MODELO DE LEONTIEF DE ENTRADA Y SALIDA, O ECUACIÓN DE PRODUCCIÓN 

x = Cx + d (4) 

Cantidad Demanda Demanda 

producida intermedia final 


La ecuación (4) también se puede escribir como 7x — Cx = d, o 

(/ - C)x = d (5) 

EJEMPLO 2 Considere la economía cuya matriz de consumo está dada por (3). Suponga 
que la demanda final es de 50 unidades para manufactura, 30 unidades para agricultura, y 20 
unidades para servicios. Encuentre el nivel de producción x que satisfará esta demanda. 
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SOLUCION La matriz de coeficientes en (5) es 



" 1 

0 

0 


".5 

.4 

.2" 


.5 

-.4 

-.2" 

/ -c = 

0 

1 

0 

— 

.2 

.3 

.1 

= 

-.2 

.7 

-.1 


0 

0 

1 


.1 

.1 

.3 


-.1 

-.1 

.7 


Para resolver (5), reduzca por filas la matriz aumentada 


.5 

-.4 

-.2 

50 


5 

-4 

-2 

500" 


" 1 

0 

0 

226 ~ 

-.2 

.7 

-.1 

30 


-2 

7 

-1 

300 

~ ••• ~ 

0 

1 

0 

119 

-.1 

-.1 

.7 

20 


-1 

-1 

7 

200 


0 

0 

1 

78 


La última columna se redondea a la unidad más cercana. El área de manufactura debe pro¬ 
ducir aproximadamente 226 unidades, agricultura 119 unidades, y servicios únicamente 78 
unidades. ■ 

Si la matriz /—Ces invertible, entonces se puede aplicar el teorema 5 de la sección 2.2 
con A remplazada por (/ — C), y a partir de la ecuación (/ — C)x = d se obtiene x = (I — 
C ) 1 d. El siguiente teorema indica que, en la mayoría de los casos prácticos, 1 — C es inver¬ 
tible y el vector de producción x es económicamente factible, en el sentido de que las entradas 
de x son no negativas. 

En el teorema, el término suma de columna denota la suma de las entradas en una co¬ 
lumna de una matriz. En circunstancias ordinarias, las sumas de columna de una matriz de 
consumo son menores que 1 porque un sector debería requerir menos de una unidad de insu¬ 
mos para generar una unidad de producción. 


TEOREMA 11 Sea C la matriz de consumo de una economía, y sea d la demanda final. Si C y d tie¬ 
nen entradas no negativas, y si cada suma de columna de C es menor que uno, entonces 
(/ — Cy l existe y el vector de producción 

x — (/ — cr'd 

tiene entradas no negativas y es la solución única de 

x = Cx + d 


El siguiente análisis sugerirá por qué el teorema es cierto, y conducirá a una nueva ma¬ 
nera de calcular (/ — C) -1 . 

Una fórmula para (J — C ) _1 

Imagine que la demanda representada por d se propone a las distintas industrias al inicio del 
año, y que estas responden estableciendo sus niveles de producción en x = d, lo cual satisfará 
exactamente la demanda final. Conforme las industrias se preparan para producir d, emiten 
órdenes solicitando materia prima y otros insumos. Esto crea una demanda intermedia de 
insumos de Cd. 

Para satisfacer la demanda adicional de Cd, las industrias necesitarán como insumos 
adicionales las cantidades de C(Cd) = C 2 d. Desde luego, esto crea una segunda ronda de 
demanda intermedia, y cuando las industrias deciden producir aún más para satisfacer esta 
nueva demanda, se genera una tercera ronda de demanda, a saber, C(C 2 d) = C 3 d, y así su¬ 
cesivamente. 

En teoría, este proceso podría continuar de manera indefinida, aunque en la vida real no 
ocurriría en una sucesión tan rígida de acontecimientos. Podemos elaborar un diagrama de 
esta situación hipotética de la siguiente forma: 
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Demanda que debe 
satisfacerse 

Insumos necesarios para 
satisfacer esta demanda 

Demanda final 

d 

Cd 

Demanda intermedia 



la. ronda 

Cd 

C(Cd) = C 2 d 

2a. ronda 

C 2 d 

C(C 2 d) = C 3 d 

3 a. ronda 

C 3 d 

C(C 3 d) = C 4 d 


El nivel de producción x que satisfará toda esta demanda es 

x = d 4- Cd + C“d + C 3 d 4- ••• 

= (/ + C + C 2 + C 3 + •■•)<! (6) 

Para que la ecuación (6) tenga sentido, considere la siguiente identidad algebraica: 

(/ - C)(7 + C + C 2 + ••• + C m ) = I - C m+1 (7) 

Es posible demostrar que si las sumas de columna en C son todas menores que 1, entonces 
1 — C es invertible, C m se aproxima a la matriz cero cuando m crece de manera arbitraria, 
e I — C m+1 —» I. (Esto es análogo al hecho de que si un número positivo t es menor que 1, 
entonces t m —» 0 conforme m aumenta). Con base en la ecuación (7), se escribe 

(I - C )~ 1 = I + C + C 2 + C 3 + ••• + C m 
cuando las sumas de columna de C son menores que 1. (8) 

La aproximación en (8) significa que el miembro derecho puede acercarse a (/ — C) 1 tanto 
como se desee al hacer a m suficientemente grande. 

En los modelos de entrada y salida reales, las potencias de la matriz de consumo se 
aproximan a la matriz cero con cierta rapidez. Así, (8) realmente ofrece una manera práctica 
de calcular (/ — C) De la misma forma, para cualquier d, los vectores C”'d se aproximan 
al vector cero rápidamente, y (6) es una manera práctica de resolver (/ — C)x = d. Si las 
entradas de C y d son no negativas, entonces (6) indica que las entradas de x también son no 
negativas. 

Importancia económica de las entradas de (/ - C ) -1 

Las entradas de (/ — C) 1 son significativas porque pueden servir para predecir cómo tendrá 
que cambiar la producción x conforme cambie la demanda final d. De hecho, las entradas de 
la columna j de (I — C) 1 son las cantidades aumentadas que los diversos sectores ten¬ 
drán que producir para satisfacer un aumento de 1 unidad en la demanda final de producción 
del sector j. Véase el ejercicio 8. 


- NOTA NUMÉRICA - 

En cualquier problema de aplicación (no solo en economía), una ecuación Ax = b se 
puede escribir siempre como (/ — C)x = b, con C = I — A. Si el sistema es grande y 
disperso (con cero en la mayoría de sus entradas), es posible que las sumas de colum¬ 
na de los valores absolutos en C sean menores que 1. En este caso, C m —» 0. Si C m 
tiende a cero con la suficiente rapidez, (6) y (8) representarán fórmulas prácticas para 
resolver Ax = b y encontrar A -1 . 
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Álgebra de matrices 


PROBLEMA DE PRÁCTICA 

Suponga que una economía tiene dos sectores: bienes y servicios. Una unidad de producción 
de bienes requiere insumos de .2 unidades de bienes y .5 unidades de servicios. Una unidad de 
producción de servicios requiere insumos de .4 unidades de bienes y .3 unidades de servicios. 
Existe una demanda final de 20 unidades de bienes y 30 unidades de servicios. Implemente el 
modelo de Leontief de entrada y salida para esta situación. 


2.6 EJERCICIOS 



Los ejercicios 1 a 4 se refieren a una economía dividida en tres sec¬ 
tores: manufactura, agricultura y servicios. Por cada unidad de pro¬ 
ducción. manufactura requiere de .10 unidades de otras compañías 
pertenecientes a ese mismo sector, de .30 unidades del sector agricul¬ 
tura y de .30 unidades de servicios. Por cada unidad de producción, 
agricultura usa .20 unidades de su propia producción, .60 unidades 
de manufactura y .10 unidades de servicios. Por cada unidad de pro¬ 
ducción, el sector de servicios consume .10 unidades de servicios, 
.60 unidades de manufactura, pero ningún producto de agricultura. 

1. Construya la matriz de consumo adecuada para esta economía, 
y determine cuáles demandas intermedias se crean si agricultura 
planea producir 100 unidades. 

2. Determine los niveles de producción que se necesitan para sa¬ 
tisfacer una demanda final de 20 unidades para agricultura, sin 
demanda final para los otros sectores. (No calcule una matriz 
inversa). 

3. Determine los niveles de producción necesarios para satisfa¬ 
cer una demanda final de 20 unidades para manufactura, sin 
demanda final para los otros sectores. (No calcule una matriz 
inversa). 


4. Determine los niveles de producción necesarios para satisfacer 
una demanda final de 20 unidades para manufactura, 20 para 
agricultura y 0 unidades para servicios. 


5. 


Considere el modelo de producción x 
nomía con dos sectores, donde 



Cx + d para una eco- 


Use una matriz inversa y determine el nivel de producción nece¬ 
sario para satisfacer la demanda final. 


6. Repita el ejercicio 5 con C 


.2 

.6 



16 

12 


7. Sean C y d como en el ejercicio 5. 


a) Determine el nivel de producción necesario para satisfa¬ 
cer una demanda final para una unidad de producción del 
sector 1. 

b) Con base en una matriz inversa, determine el nivel de 
producción necesario para satisfacer una demanda final 
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c) Con base en el hecho de que 


51 

30 


50 

30 


+ 


1 

0 


, expli¬ 


que cómo y por qué están relacionadas las respuestas a los 
incisos a) y fe) y al ejercicio 5. 


8. Sea C una matriz de consumo de n x n cuyas sumas de columna 
son menores a 1. Sea x el vector de producción que satisface la 
demanda final d, y sea Ax un vector de producción para satis¬ 
facer una demanda final diferente Ad. 

a) Demuestre que si la demanda final cambia de d a d + Ad, 
entonces el nuevo nivel de producción debe ser x + Ax. 
Así, Ax indica las cantidades en que debe cambiar la pro¬ 
ducción para compensar el cambio Ad en la demanda, 
fe) Sea Ad el vector en IR" con 1 en la primera entrada y ceros 
en las demás. Explique por qué la producción correspon¬ 
diente Ax es la primera columna de (7 — C) _1 . Esto muestra 
que la primera columna de (7 — CF 1 indica las cantida¬ 
des que deben producir los diversos sectores para satisfacer 
un aumento de una unidad en la demanda final para la pro¬ 
ducción del sector 1. 


9. Resuelva la ecuación de producción de Leontief para una eco¬ 
nomía con tres sectores, considerando que 



' .2 

.2 

.0“ 


'40' 

c = 

.3 

.1 

.3 

y d = 

60 


.1 

.0 

.2 


80 


10. La matriz de consumo C para la economía de Estados Unidos 
en 1972 tiene la propiedad de que cada entrada de la matriz 
(7 — CF 1 es diferente de cero (y positiva). 1 ¿Qué dice esto acer¬ 
ca del efecto de aumentar la demanda de la producción sola¬ 
mente en un sector de la economía? 


12. Sea C una matriz de consumo tal que C"‘ —» 0 cuando m —» oo, 
y para m = 1, 2,..., sea D m = I + C + ••• + C m . Encuentre 
una ecuación en diferencias que relacione D m y Z) m +i y, a par¬ 
tir de ella, obtenga un procedimiento iterativo con la finalidad 
de calcular la fórmula (8) para (7 — CF 1 . 

13. [M] La siguiente matriz de consumo C está basada en datos de 
entrada y salida para la economía de Estados Unidos en 1958, 
con datos para 81 sectores agrupados en 7 sectores de mayores 
dimensiones: 1. productos no metálicos personales y domés¬ 
ticos, 2. productos metálicos finales (como vehículos motori¬ 
zados), 3. productos básicos de metal y minería, 4. productos 
básicos no metálicos y de agricultura, 5. energía, 6. servicios, y 
7. entretenimiento y productos diversos. 2 Encuentre los nive¬ 
les de producción necesarios para satisfacer la demanda final d. 
(Las unidades están en millones de dólares). 


.1588 

.0057 

.0264 

.3299 

.0089 

.1190 

.0063 


.0064 

.2645 

.1506 

.0565 

.0081 

.0901 

.0126 


.0025 

.0436 

.3557 

.0495 

.0333 

.0996 

.0196 


.0304 

.0099 

.0139 

.3636 

.0295 

.1260 

.0098 


.0014 

.0083 

.0142 

.0204 

.3412 

.1722 

.0064 


.0083 

.0201 

.0070 

.0483 

.0237 

.2368 

.0132 


.1594 

.3413 

.0236 

.0649 

.0020 

.3369 

.0012 


d = 


74,000 

56,000 

10.500 
25,000 

17.500 
196,000 

5,000 


11. La ecuación de producción de Leontief, x = Cx + d, general¬ 
mente está acompañada por una ecuación de precio dual, 

p = C T p + v 

donde p es un vector de precio cuyas entradas listan el precio 
por unidad de producción de cada sector, y v es un vector de va¬ 
lor agregado cuyas entradas listan el valor agregado por unidad 
de producción. (El valor agregado incluye salarios, utilidades, 
depreciación, etcétera). Un hecho importante en economía es 
que el producto interno bruto (PIB) se puede expresar de dos 
maneras: 

{producto interno bruto} = p r d = v r x 

Compruebe la segunda igualdad. [Sugerencia: Calcule p r x de 
dos maneras]. 


14. [M] El vector de demanda del ejercicio 13 es razonable para 
los datos de 1958, pero el análisis de Leontief de la economía 
mencionado en el mismo ejercicio utilizó un vector de demanda 
más cercano a los datos de 1964: 

d = (99640, 75548, 14444, 33501, 23527, 263985, 6526) 
Encuentre los niveles de producción necesarios para satisfacer 
esta demanda. 

15. [M] Use la ecuación (6) para resolver el problema del ejerci¬ 
cio 13. Considere que x <0) = d, y para k = 1, 2,..., calcule 
x® = d + Cr® ®. ¿Cuántos pasos se necesitan para obtener 
una respuesta al ejercicio 13 con cuatro cifras significativas? 


1 Wassily W. Leontief, “The World Economy of the Year 2000”, Scientific 2 Wassily W. Leontief, “The Structure of the U.S. Economy”, Scientific Ame- 

American, septiembre de 1980, pp. 206-231. rican, abril de 1965, pp. 30-32. 



138 


CAPITULO 2 


Álgebra de matrices 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Se cuenta con los siguientes datos: 


Insumos necesarios por unidad de producción 


Comprados por: 

Bienes 

Servicios 

Demanda externa 

Bienes 

.2 

.4 

20 

Servicios 

.5 

.3 

30 


El modelo de entrada y salida de Leontief es x = Cx + d, donde 


C = 


.2 

.5 


.4 

.3 


d = 


20 

30 


2.7 APLICACIONES A LOS GRÁFICOS POR COMPUTADORA 

Los gráficos por computadora son imágenes desplegadas o animadas en una pantalla de compu¬ 
tadora. Las aplicaciones de los gráficos por computadora están ampliamente difundidas y 
proliferan con rapidez. Por ejemplo, el diseño asistido por computadora (CAD) es una parte 
integral de muchos procesos de ingeniería, como el proceso de diseño de aeronaves descrito 
en la introducción de este capítulo. La industria del entretenimiento ha realizado el uso más 
espectacular de los gráficos por computadora: desde los efectos especiales en las películas 
Matrix a la Xbox de Playstation 2. 

La mayoría de los programas interactivos de cómputo diseñados para los negocios y la 
industria utilizan gráficos por computadora en los despliegues de pantalla y en otras funcio¬ 
nes, como el despliegue gráfico de datos, la autoedición, y la producción de diapositivas para 
presentaciones comerciales y educativas. Por consiguiente, cualquier persona que estudie un 
lenguaje de computadora siempre pasa algún tiempo aprendiendo a usar gráficos de, por lo 
menos, dos dimensiones (2D). 

En esta sección se examinará algo de las matemáticas básicas que se usan para manipu¬ 
lar y desplegar imágenes gráficas, como el modelo de alambre de un avión. Una imagen (o 
dibujo) de ese tipo consta de varios puntos, líneas rectas o curvas conectados, e información 
sobre cómo llenar regiones cerradas delimitadas por esas rectas y curvas. Con frecuencia, las 
líneas curvas se aproximan utilizando segmentos de línea recta cortos, y una figura se define 
matemáticamente por medio de una lista de puntos. 

Entre los símbolos gráficos más sencillos utilizados en 2D están las letras usadas como 
etiquetas en la pantalla. Algunas letras se guardan como objetos de alambre; otras, con porcio¬ 
nes curvas, se almacenan con fórmulas matemáticas adicionales para las curvas. 


8 6 5 



FIGURA 1 

N regular. 


EJEMPLO 1 La letra N mayúscula de la figura 1 está determinada por ocho puntos o 
vértices. Las coordenadas de los puntos se pueden almacenar en una matriz de datos, D. 


1 

coordenada x 0 
coordenada y 0 


2 3 

.5 .5 

0 6.42 


Vértice: 
4 5 

6 6 

0 8 


6 7 

5.5 5.5 

8 1.58 


8 



Además de D, es necesario especificar cuáles vértices están conectados con líneas, pero aquí 
se omite este detalle, ■ 


La principal razón para describir los objetos gráficos por medio de segmentos de lí¬ 
neas rectas es que las transformaciones estándar en los gráficos por computadora mapean 
segmentos de línea sobre otros segmentos de línea. (Por ejemplo, véase el ejercicio 26 de 
la sección 1.8). Una vez transformados los vértices que describen un objeto, es posible co- 
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FIGURA 2 

N inclinada. 


néctar sus imágenes con las líneas rectas adecuadas para producir la imagen completa del 
objeto original. 


EJEMPLO 2 A partir de A = 


25 

1 


describa el efecto de la transformación de 


trasquilado x i-> Ax sobre la letra N del ejemplo 1. 


SOLUCIÓN Por la definición de multiplicación de matrices, las columnas del producto AD 
contienen las imágenes de los vértices de la letra N. 


1 



2 3 

.5 2.105 

0 6.420 


4 5 6 

6 8 7.5 
0 8 8 


7 8 

5.895 2 

1.580 8 


Los vértices transformados se dibujan en la figura 2, junto con los segmentos de línea conec- 
tores que corresponden a los de la figura original. ■ 


La N cursiva de la figura 2 se ve demasiado ancha. Para compensar ese hecho, se puede 
reducir la anchura mediante una transformación de escala que afecta las coordenadas x de los 
puntos. 



Transformación compuesta de N. 


EJEMPLO 3 Calcule la matriz de la transformación que realiza una transformación de 
trasquilado, como en el ejemplo 2, y que después modifica a escala todas las coordenadas x 
por un factor de .75. 


SOLUCIÓN La matriz que multiplica la coordenada x de un punto por .75 es 


.75 0 

0 1 


Así que la matriz de la transformación compuesta es 


SA 


.75 

0 

.75 

0 


0 

1 

.1875 

1 


.25 

1 


El resultado de esta transformación compuesta se muestra en la figura 3. ■ 

Las matemáticas de los gráficos por computadora están íntimamente relacionadas con la 
multiplicación de matrices. Por desgracia, trasladar un objeto a una pantalla no corresponde 
directamente a la multiplicación de matrices porque la traslación no es una transformación 
lineal. La manera estándar de evitar esta dificultad es introducir lo que se conoce como coor¬ 
denadas homogéneas. 



Traslación por 


4 

3 


Coordenadas homogéneas 

Cada punto (x, y) en IR 2 se puede identificar con el punto (x, y, 1) en el plano en R 3 que se 
encuentra una unidad por encima del plano xy. Se dice que (x, y) tiene coordenadas homogé¬ 
neas ( x , y, 1). Por ejemplo, el punto (0, 0) tiene coordenadas homogéneas (0, 0, 1). Las coor¬ 
denadas homogéneas de puntos no se suman ni se multiplican por escalares, pero se pueden 
transformar mediante multiplicación por matrices de 3 x 3. 

EJEMPLO 4 Una traslación de la forma ( x , y) •-> (x + h. y + k) se escribe en coorde¬ 
nadas homogéneas como (x, y, 1) i — > (jc + h. y + k, 1). Esta transformación se puede calcular 
mediante la multiplicación de matrices: 


■ 1 

0 

h~ 

X 


x + h 

0 

1 

k 

y 

= 

y+ k 

0 

0 

1 

i 


1 
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EJEMPLO 5 Cualquier transformación lineal sobre R 2 se representa con respecto a las 

' A 0' 

coordenadas homogéneas por medio de una matriz particionada de la forma 


0 1 


de A es una matriz de 2 x 2. Ejemplos típicos son: 


, don- 


eos <p 

—sen cp 

0 " 


" 0 

1 

0 " 


s 

0 

0 " 

sen cp 

eos cp 

0 

, 

1 

0 

0 

, 

0 

t 

0 

0 

0 

1 


0 

0 

1 


0 

0 

1 


Rotación en sentido 
antihorario en tomo 
al origen, ángulo tp 


Reflexión 
a través de y — x 


Escala de x por i 
y de y por t 


Figura original 


Después del escalamiento 


Después de la rotación 


Después de la traslación 


Transformaciones compuestas 

El movimiento de una figura en la pantalla de una computadora a menudo requiere de dos 
o más transformaciones básicas. La composición de tales transformaciones corresponde a la 
multiplicación de matrices cuando se usan coordenadas homogéneas. 

EJEMPLO 6 Encuentre la matriz de 3 x 3 que corresponde a la transformación com¬ 
puesta de un escalamiento por .3, una rotación de 90° en torno al origen y, por último, una 
traslación que suma ( — .5, 2) a cada punto de una figura. 

SOLUCIÓN Si i p = 7t/ 2, entonces sen cp = 1 y eos <p = 0. A partir de los ejemplos 4 y 5, 
se tiene que 


X 

Escalamiento 

'.3 

0 

0" 

X 

y 

- > 

0 

.3 

0 

y 

1 


0 

0 

1 

i 


Rotación 

'0 

-1 

0" 

".3 

0 

0" 

X 

- > 

1 

0 

0 

0 

.3 

0 

y 


0 

0 

1 

0 

0 

1 
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Traslación 

'1 

0 

-.5" 

"0 

-1 

0" 

".3 

0 

0" 

X 

- > 

0 

1 

2 

1 

0 

0 

0 

.3 

0 

y 


0 

0 

1 

0 

0 

1 

0 

0 

1 

i 


La matriz para la transformación compuesta es 


" i 

0 

-.5" 

"0 

-1 

0" 

".3 

0 

0~ 

0 

i 

2 

1 

0 

0 

0 

.3 

0 

0 

0 

1 

0 

0 

1 

0 

0 

1 


"0 

-1 

-.5" 

".3 

0 

0" 


" 0 

-.3 

-.5" 

1 

0 

2 

0 

.3 

0 

= 

.3 

0 

2 

0 

0 

1 

0 

0 

1 


0 

0 
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Gráficos 3D por computadora 

Algunos de los más recientes y estimulantes trabajos en gráficos por computadora se relacio¬ 
nan con el modelado molecular. Un biólogo tiene la posibilidad de examinar una molécula 
simulada de proteína utilizando gráficos tridimensionales (3D), y así buscar los sitios activos 
que pueden aceptar la molécula de un medicamento. El biólogo podrá hacer girar y trasladar 
un medicamento experimental para tratar de unirlo a la proteína. Esta capacidad de visualizar 
reacciones químicas potenciales es vital para la investigación de medicamentos modernos y 
del cáncer. De hecho, los avances en el diseño de medicamentos dependen, en cierta medida, 
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del progreso que se logre en la capacidad de los gráficos por computadora para construir si¬ 
mulaciones realistas de las moléculas y sus interacciones. 1 

La investigación actual en el modelado de moléculas se enfoca en la realidad virtual, un 
entorno en el que un investigador puede ver y sentir la molécula de medicamento deslizarse 
dentro de la proteína. En la figura 4 se ilustra el proceso de retroalimentación táctil con un 
manipulador remoto que despliega la fuerza. 



FIGURA 4 Modelado molecular en realidad virtual. 
(Departamento de Ciencias de la Computación, 
University of North Carolina en Chapel Hill. 
Fotografía de Bo Strain). 


Otro diseño de realidad virtual consiste en un casco y un guante que detectan los movimientos 
de la cabeza, la mano y los dedos. El casco incluye dos pequeñas pantallas de computadora, 
una para cada ojo. Hacer que este medio virtual sea más realista es un desafío para ingenieros, 
científicos y matemáticos. Las matemáticas que se manejan aquí apenas abren la puerta a este 
campo de la investigación. 

Coordenadas 3D homogéneas 

Por analogía con el caso bidimensional, se dice que (x, y, z, 1) son las coordenadas homogé¬ 
neas para el punto (x, y, z) en IR 3 . En general, ( X , Y, Z, H) son las coordenadas homogéneas 
para ( x , y, z) si H + 0 y 


X Y Z 

X= H' y= H yZ= H (1) 

Cada múltiplo escalar diferente de cero de (x, y, z, 1) proporciona un conjunto de coordenadas 
homogéneas para (x, y, z). Por ejemplo, (10, —6, 14, 2) y (—15, 9, —21, —3) son coordena¬ 
das homogéneas para (5, —3, 7). 

El siguiente ejemplo ilustra las transformaciones utilizadas en el modelado molecular 
para introducir un medicamento en una molécula de proteína. 

EJEMPLO 7 Encuentre las matrices de 4 x 4 para las siguientes transformaciones: 
a) Rotación en torno al eje y a través de un ángulo de 30°. (Por convención, un ángulo posi¬ 
tivo es un giro en sentido antihorario cuando se ve hacia el origen desde la mitad positiva 
del eje de rotación, en este caso, el eje y). 


1 Robert Pool. “Computing in Science”, Science 256, 3 de abril de 1992, p. 45. 
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b) Traslación mediante el vector p = (—6, 4, 5). 


SOLUCIÓN 


z 



FIGURA 5 


a) Primero, construya la matriz de 3 x 3 para la rotación. El vector ei gira hacia abajo en la 
dirección del eje z negativo, y se detiene en (eos 30°, 0 , —sen 30°) = (V3/2, 0 , —.5). El 
vector e 2 sobre el eje y no se mueve, pero e 3 sobre el eje z gira hacia abajo en dirección del 
eje x positivo, hasta detenerse en (sen 30°, 0, eos 30°) = (.5, 0, a/3/2). Véase la figura 5. 
De acuerdo con la sección 1.9, la matriz estándar para esta rotación es 


b ) 


"V3/2 0 .5 

0 1 0 

-.5 0 V3/2_ 

Por lo tanto, la matriz de rotación para las coordenadas homogéneas es 

" a/3/2 0 .5 0" 

0 1 0 o 

-.5 0 V3/2 0 

0 0 0 1 _ 

Se desea que (x, y, z, 1) mapee a (x — 6, y + 4, z + 5, 1). La matriz que logra esto es 

"1 0 0 - 6 " 

0 10 4 

0 0 15 

0 0 0 1 


Proyecciones en perspectiva 

Un objeto tridimensional se representa en la pantalla de dos dimensiones de una computadora 
proyectándolo sobre un plano visual. (Se omiten otros pasos importantes, como la selección 
de la parte del plano visual que se desplegará en la pantalla). Para simplificar, considere que el 
plano xy representa la pantalla de la computadora e imagine que el ojo de un observador está 
sobre el eje positivo z, en un punto (0, 0, d). Una proyección en perspectiva mapea cada punto 
(x, y, z) sobre un punto de imagen (x*, y*, 0) de manera que los dos puntos y la posición del 
ojo, llamada centro de proyección, estén sobre una recta. Véase la figura 6a). 



a) b) 

FIGURA 6 Proyección en perspectiva de (x, y, z) sobre (x*, y*, 0). 
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El triángulo en el plano xz de la figura 6a) se vuelve a trazar en el inciso b) mostrando la 
longitud de los segmentos de recta. Con triángulos similares se muestra que 


x* x „ dx x 

d d - z y d — z 1- z/d 


De manera análoga, 


y 


* 


■V 

1 - z/d 


Usando coordenadas homogéneas, es posible representar la proyección en perspectiva mediante 

una matriz, por ejemplo, P. Se desea que (x, y, z, 1) se mapee en (--,-—-, 0, 1 V 

V 1 ~z/d 1 — z/d ) 

Al modificar a escala estas coordenadas por 1 —z/d, también se puede utilizar (x, y, 0, 
1 — z/d) como coordenadas homogéneas para la imagen. Ahora resulta fácil desplegar P. 
De hecho, 


X 


O 

O 

O 


X 


X 

y 


0 10 0 


y 


y 

z 


0 0 0 0 


z 


0 

1 


1 

O 

O 

1 _ 


1 


1 

1 

(N 

1 _ 


EJEMPLO 8 Sea S la caja con vértices (3, 1,5), (5, 1, 5), (5,0,5), (3,0, 5), (3,1,4), (5,1, 
4), (5, 0, 4) y (3, 0, 4). Encuentre la imagen de S bajo la proyección en perspectiva con centro 
de proyección en (0, 0, 10). 

SOLUCIÓN Sean P la matriz de proyección y D la matriz de datos para S usando coordena¬ 
das homogéneas. La matriz de datos para la imagen de S es 


PD 


Vértice: 







1 

2 

3 

4 

5 

6 

7 

8 

i 

0 

0 

0 


"3 

5 

5 

3 

3 

5 

5 

3" 
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1 

0 

0 


1 

1 

0 

0 

1 

1 

0 

0 

0 

0 

0 

0 


5 

5 

5 

5 

4 

4 

4 

4 

0 

0 

-1/10 

1 


1 

1 

1 

1 

1 

1 

1 

1 

3 

5 

5 3 

- 

i 

5 

5 

3” 






1 

1 

0 0 

1 

1 

0 

0 






0 

0 

0 0 

0 

0 

0 

0 






.5 

.5 

.5 .5 

.6 

.6 

.6 

.6 








S bajo la transformación de 
perspectiva. 


Para obtener las coordenadas en IR 3 , use la ecuación (1) que está antes del ejemplo 7 y divida 
las tres entradas superiores de cada columna entre la entrada correspondiente de la cuarta 
fila: 


1 

6 

2 

0 


2 

10 

2 

0 


Vértice: 

3 4 5 6 

10 6 5 8.3 

0 0 1.7 1.7 

0 0 0 0 


7 8 

8.3 5 

0 0 

0 0 


WEB 


En el sitio Web de este libro se presentan algunas aplicaciones interesantes de los gráficos 
por computadora, incluyendo un análisis más profundo de las proyecciones en perspectiva. 
Uno de los proyectos para computadora presentados en el sitio Web implica una animación 
sencilla. 
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CAPITULO 2 


Álgebra de matrices 


- NOTA NUMÉRICA - 

El movimiento continuo de objetos gráficos en 3D requiere de cálculo intenso con ma¬ 
trices de 4 x 4, en especial cuando las superficies deben parecer realistas, con la textura 
e iluminación adecuadas. Las estaciones de trabajo para gráficos por computadora 
de acabado fino realizan operaciones con matrices de 4 x 4 y algoritmos de gráficos 
integrados en sus microchips y circuitos. Estas estaciones son capaces de realizar miles 
de millones de multiplicaciones de matrices por segundo necesarias para presentar la 
animación realista en color en los programas de juegos 3D. 2 


Lectura adicional 

James D. Foley, Andries van Dam, Steven K. Feiner y John F. Hughes, Computer Graphics: 
Principies and Practice, 3a. ed. (Boston, MA: Addison-Wesley, 2002), capítulos 5 y 6. 

PROBLEMA DE PRÁCTICA 

La rotación de una figura alrededor de un punto p en IR 2 se logra primero con una traslación 
de la figura mediante —p, luego con una rotación alrededor del origen, y finalmente trasla¬ 
dándola de regreso mediante p. Véase la figura 7. Construya la matriz de 3 x 3 que hace girar 
puntos en un ángulo de —30° en torno al punto (—2, 6), usando coordenadas homogéneas. 


*2 


X 2 


*2 


*2 



X 


1 



Op 


*1 


a) Figura original. b ) Traslación al origen c ) Rotación en 

mediante -p. tomo al origen. 

FIGURA 7 Rotación de la figura con respecto al punto p. 


d) Traslación de regreso 
mediante p. 


2.7 EJERCICIOS 


1. ¿Qué matriz de 3 x 3 tendrá el mismo efecto en las coordenadas 
homogéneas para IR 2 que la matriz de corte A del ejemplo 2? 


5. Refleje los puntos a través del eje x, y después hágalos girar 45° 
con respecto al origen. 


2. Utilice multiplicación de matrices para encontrar la imagen 

'4 2 5' 


del triángulo con datos D = 


bajo la transfor- 


0 2 3 

mación que refleja los puntos a través del eje y. Bosqueje tanto 
el triángulo original como su imagen. 


En los ejercicios 3 a 8, determine las matrices de 3 x 3 que produ¬ 
cen las transformaciones 2D compuestas, usando coordenadas ho¬ 
mogéneas. 


3. Traslade con (2, 1), y después haga girar 90° con respecto al 
origen. 

4. Traslade con ( — 1, 4), y después modifique a escala la coorde¬ 
nada x por 1/2 y la coordenada y por 3/2. 


6. Haga girar los puntos 45° con respecto al origen, después reflé¬ 
jelos a través del eje x. 

7. Haga girar los puntos un ángulo de 60° con respecto al punto 

( 6 , 8 ). 

8. Haga girar los puntos un ángulo de 45° con respecto al punto 
(3, 7). 

9. Una matriz de datos de 2 x 100 contiene las coordenadas de 
100 puntos. Calcule el número de multiplicaciones necesarias 
para transformar estos puntos usando dos matrices arbitrarias 
A y 6 de 2 x 2. Considere las dos posibilidades A(BD) y ( AB)D. 
Analice las implicaciones de sus resultados con los cálculos de 
los gráficos por computadora. 


2 Véase Jan Ozer, "High-Performance Graphics Boards”, PC Magazine 19, 1 de septiembre de 2000, pp. 187-200. 
También “The Ultímate Upgrade Guide: Moving On Up”, PC Magazine 21. 29 de enero de 2002, pp. 82-91. 
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10. Considere las siguientes transformaciones geométricas 2D: D , 
una dilatación (en la que se modifica la escala de las coordena¬ 
das x y y por el mismo factor); R, una rotación; y T, una trasla¬ 
ción. ¿Conmuta D con R? Es decir, ¿es D(R(x)) = R(D(x)) para 
toda x en IR 2 ? ¿Conmuta D con TI ¿Conmuta R con 7? 


11. Una rotación en la pantalla de una computadora a veces se imple- 
menta como el producto de dos transformaciones de trasquilado 
y escalamiento, que pueden acelerar los cálculos para determi¬ 
nar cómo se presenta en realidad una imagen gráfica en tér¬ 
minos de los pixeles de la pantalla. (La pantalla consiste en filas 
y columnas de puntos pequeños, llamados pixeles). La primera 
transformación Ai trasquila verticalmente y después comprime 
cada columna de pixeles; la segunda transformación At trasquila 
horizontalmente y después estira cada fila de pixeles. Sean 


1 

0 

sen ip 

eos (p 

0 

0 

sec (p 

— tan i p 

0 

1 

0 

0 


y muestre que la composición de las dos transformaciones es 
una rotación en R 2 . 



12. Una rotación en R 2 , por lo general, requiere cuatro multiplica¬ 
ciones. Calcule el siguiente producto y demuestre que la matriz 
para una rotación se puede factorizar en tres transformaciones 
de trasquilado (cada una de las cuales requiere de tan solo una 
multiplicación). 


' 1 

— tan (p/2 

0' 


1 

0 

0' 

0 

1 

0 


sen (p 

1 

0 

0 

0 

1 


0 

0 

1 


1 — tan (p/2 0 

0 1 0 

0 0 1 


13. 


Las transformaciones usuales en coordenadas homogéneas para 
gráficos 2D por computadora implican matrices de 3 x 3 en la 


forma 


A 

0 r 


P 

1 


donde A es una matriz de 2 x 2 y p está en R 2 . 


Demuestre que una transformación de este tipo equivale a una 
transformación lineal en R 2 seguida por una traslación. [Suge¬ 
rencia: Encuentre una factorización de matrices adecuada en la 
que intervengan matrices particionadas]. 


14. Demuestre que la transformación del ejercicio 7 es equivalente 
a una rotación con respecto al origen seguida por una traslación 
mediante p. Encuentre p. 

15. ¿Qué vector en R 3 tiene las coordenadas homogéneas 

(i _I _i IV7 
'■2’ 4' 8’ 24'- 

16. ¿Son (1, —2, —3, 4) y (10, —20, —30, 40) coordenadas homo¬ 
géneas para el mismo punto en R 3 ? ¿Por qué? 


17. Proporcione la matriz de 4 x 4 que hace girar puntos en R 3 
con respecto al eje x a través de un ángulo de 60°. (Véase la 
figura). 


z 



18. Encuentre la matriz de 4 x 4 que hace girar puntos en R 3 con 
respecto al eje z a través de un ángulo de —30°, y después los 
traslada mediante p = (5, —2, 1). 

19. Sea S el triángulo con vértices (4.2, 1.2, 4), (6, 4, 2) y (2, 2, 6). 
Encuentre la imagen de S bajo la proyección en perspectiva con 
centro de proyección en (0, 0, 10). 

20. Sea S el triángulo con vértices (7, 3, —5), (12, 8, 2), (1, 2, 1). 
Encuentre la imagen de S bajo la proyección en perspectiva con 
centro de proyección en (0, 0, 10). 

Los ejercicios 21 y 22 se refieren a la manera en que se especifica el 
color para mostrarse en gráficos por computadora. En una pantalla 
de computadora, el color se codifica utilizando tres números ( R , G, 
B) para indicar la cantidad de energía que un cañón debe transmitir 
a los puntos fosforescentes rojos, verdes y azules sobre la pantalla 
de la computadora. (Un cuarto número especifica la luminosidad o 
intensidad del color). 

21. [M] El color real que ve un observador en una pantalla está 
influido por el tipo específico y la cantidad de material fosfores¬ 
cente en la pantalla. De esta manera, cada fabricante de panta¬ 
llas de computadora debe hacer la conversión entre los datos ( R , 
G, B) y un estándar internacional para color, CIE, que usa tres 
colores primarios llamados X,YyZ. Una conversión típica para 
el material fosforescente de persistencia breve es 


'.61 

.29 

.150' 

' R~ 


"X' 

.35 

.59 

.063 

G 

= 

y 

.04 

.12 

.787 

B 


z 


Un programa de computadora envía un flujo de información 
acerca del color a la pantalla usando datos del estándar CIE (X, 
Y, Z). Encuentre la ecuación que convierte esta información en 
los datos (R, G, B) que necesita el cañón de electrones de la 
pantalla. 

22. [M] La señal transmitida por la televisión comercial describe 
cada color por medio de un vector (Y, I, Q ). Si la pantalla es en 
blanco y negro, solo se utiliza la coordenada Y. (Esto da una me¬ 
jor imagen monocromática que si se usa el estándar CIE para los 
colores). La correspondencia entre YIQ y un color “estándar” 
RGB está dada por 


y" 


" .299 

.587 

.114' 

' R~ 
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.596 

-.275 

-.321 
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.212 
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(Un fabricante de pantallas cambiaría las entradas de la matriz 
para que funcionaran con sus pantallas RGB). Encuentre la 
ecuación que convierte los datos Y1Q transmitidos por la esta¬ 


ción de televisión a los datos RGB necesarios para la pantalla 
del televisor. 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 

Acomode las matrices de derecha a izquierda para las tres operaciones. Usando p = (—2, 6), 
cos(—30°) = a/3/2 y sen( — 30°) = — .5, se tiene: 


Traslación de Rotación con Traslación 

regreso mediante p respecto al origen mediante —p 


■ 1 

0 

-2" 

"V3/2 

1/2 

0" 

" 1 

0 

2" 

0 

1 

6 

-1/2 

V3/2 
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0 

1 

-6 

0 

0 

1 

0 

0 

1 _ 
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0 

1 


V3/2 1/2 V3-5 

-1/2 V5/2 -3V3 + 5 

0 0 1 


2.8 


SUBESPACIOS DE U 


n 


Esta sección se concentra en los importantes conjuntos de vectores en R" llamados subespa¬ 
cios. Con frecuencia surgen subespacios conectados con alguna matriz A, los cuales brindan 
información útil acerca de la ecuación Ax = b. Los conceptos y la terminología de esta sec¬ 
ción se usarán repetidamente a lo largo del libro. 1 


DEFINICIÓN 



FIGURA 1 Gen {vi, V 2 } tiene un 
plano a través del origen. 


Un subespacio de R" es cualquier conjunto H en R" que tenga tres propiedades: 

a) El vector cero está en H. 

b) Para cada u y v en H, la suma u + v está en H. 

c ) Para cada u en H y cada escalar c, el vector cu está en //. 


Dicho con palabras, un subespacio es cerrado bajo la suma y la multiplicación escalar. 
Como se verá en los siguientes ejemplos, casi todos los conjuntos de vectores analizados en 
el capítulo 1 son subespacios. Por ejemplo, un plano que pasa por el origen es la manera es¬ 
tándar de visualizar el subespacio del ejemplo 1. Véase la figura 1. 

EJEMPLO 1 Si Vi y V2 están en R" y H = Gen {vi, V2}, entonces H es un subespacio 
de R". Para comprobar este enunciado, observe que el vector cero está en H (porque 
Ovi + OV 2 es una combinación lineal de Vi y V 2 ). Ahora tome dos vectores arbitrarios en H, 
por ejemplo, 


Luego, 


U = UVi + S2\2 y V = flVi + t 2 \2 


U + V = (í! + fi)Vi + (i 2 + t 2 )y 2 


lo que demuestra que u + v es una combinación lineal de y V 2 y, por lo tanto, está 
en H. Además, para cualquier escalar c, el vector cu está en H, ya que cu = cí.v 1 v 1 + s 2 y 2 ) = 
(Cíi)Vi + (CÍ 2 )V2- ■ 


1 Las secciones 2.8 y 2.9 se incluyen aquí para permitir que los lectores pospongan el estudio de la mayor parte o el 
total de los siguientes dos capítulos y vayan directamente al capítulo 5, si así lo desean. Omita estas dos secciones 
si planea estudiar el capítulo 4 antes que el capítulo 5. 
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Si Vi no es cero, y si V2 es un múltiplo de Vi, entonces Vi y V2 simplemente generan 
una recta que pasa a través del origen. Por lo tanto, una recta que pasa por el origen es otro 
ejemplo de un subespacio. 


X 


2 


EJEMPLO 2 Una recta L que no pasa por el origen no es un subespacio, porque no con¬ 
tiene al origen, como se requiere. Además, la figura 2 muestra que L no es cerrada bajo la 
suma o la multiplicación escalar. ■ 




K* y 


SV 


vi # 0, V2 = k\ i. 



u + v 

2w 


\ u • 




w 


V 





u + v no está sobre L 

2w no está sobre L 


FIGURA 2 


EJEMPLO 3 Para vi,..., \ p en R", el conjunto de todas las combinaciones lineales de 
Vi,. .., v p es un subespacio de R". La comprobación de este enunciado es similar al argumento 
dado en el ejemplo 1. Ahora nos referimos a Gen {vi,..., \ p ¡ como el subespacio generado 
por vi,..., v p . ■ 

Observe que R" es un subespacio de sí mismo porque tiene las tres propiedades reque¬ 
ridas para un subespacio. Otro subespacio especial es el conjunto que consta exclusivamente 
del vector cero en R". Este conjunto, llamado subespacio cero, también satisface las condi¬ 
ciones de un subespacio. 


Espacio de columnas y espacio nulo de una matriz 

Los subespacios de R" generalmente se presentan en aplicaciones y en la teoría en una de 
dos formas. En ambos casos, es posible relacionar el subespacio con una matriz. 


DEFINICIÓN 


El espacio de columnas de una matriz A es el conjunto Col A de todas las combina¬ 
ciones de las columnas de A. 



Si A = [ai ••• a„], con las columnas en R'", entonces Col A es lo mismo que 
Gen {ai,..., a,,}. En el ejemplo 4 se muestra que el espacio columna de una matriz de 
m x n es un subespacio de R m . Observe que Col A es igual a R'" solo cuando las colum¬ 
nas de A generan a R'". Si no la generan, Col A es solo una parte de R'". 


EJEMPLO 4 

Sean A = 

1 

-4 

-3 

6 

-4" 

-2 

y b = 

3" 

3 

columna de A. 


-3 

7 

6 


-4 


Determine si b es el espacio 


SOLUCIÓN El vector b es una combinación lineal de las columnas de A si y solo si b se pue¬ 
de escribir como Ax para alguna x, es decir, si y solo si la ecuación Ax = b tiene una solución. 
Reduciendo por filas a la matriz aumentada [A b], se tiene 


1 

-3 

-4 

3" 


r i -3 

-4 

3 


" 1 

-3 

-4 

3" 

-4 

6 

-2 

3 


'O 

1 

o 

-18 

15 


0 

-6 

-18 

15 

-3 

7 

6 

-4 


<N 

1 

O 
_1 

-6 

5 


0 

0 

0 

0 


se concluye que Ax = b es consistente, y b está en Col A. 
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DEFINICIÓN 


TEOREMA 12 


DEFINICIÓN 


*3 



*1 

FIGURA 3 

La base estándar para IR 3 . 


La solución del ejemplo 4 indica que cuando un sistema de ecuaciones lineales está es¬ 
crito en la forma 4x = b, el espacio columna de A es el conjunto de todas las b para las que 
el sistema tiene una solución. 

El espacio nulo de una matriz A es el conjunto Nul A de todas las soluciones posibles 
para la ecuación homogénea Ax = 0. 

Cuando A tiene n columnas, las soluciones de Ax = 0 pertenecen a IR", y el espacio nulo 
de A es un subconjunto de R". De hecho, Nul A tiene las propiedades de un subespacio de 
matrices de R". 


El espacio nulo de una matriz A de m x n es un subespacio de R". De manera equiva¬ 
lente, el conjunto de todas las soluciones posibles para un sistema Ax = 0 de m ecuacio¬ 
nes lineales homogéneas con n incógnitas es un subespacio de R". 

DEMOSTRACION El vector cero está en Nul A (porque A0 = 0). Para demostrar que 
Nul A satisface las otras dos propiedades requeridas para conformar un subespacio, tome 
cualesquiera u y v en Nul A. Es decir, se supone que Au = 0 y Av = 0. Así, por una propie¬ 
dad de la multiplicación de matrices, 

A(u + v) = Au + Av = 0 + 0 = 0 

Por lo tanto, u + v satisface Ax = 0, y así u + v está en Nul A. Además, para cualquier es¬ 
calar c, A(cu) = c(Au) = c(0) = 0, lo que demuestra que cu está en Nul A. ■ 

Para saber si un vector dado v está en Nul A, solo se calcula Av para ver si Av es el vec¬ 
tor cero. Puesto que Nul A se describe por medio de una condición que debe comprobarse 
para cada vector, se dice que el espacio nulo está definido implícitamente. En contraste, el 
espacio columna se define explícitamente, ya que los vectores en Col A se pueden construir 
(con combinaciones lineales) a partir de las columnas de A. Para crear una descripción ex¬ 
plícita de Nul A, se resuelve la ecuación Ax = 0 y se escribe la solución en forma vectorial 
paramétrica. (Véase el ejemplo 6 que se presenta más adelante). 2 

Base para un subespacio 

Como, por lo general, un subespacio contiene un número infinito de vectores, algunos problemas 
relacionados con subespacios se manejan mejor trabajando con un conjunto finito y pequeño de 
vectores que genere el subespacio. Cuanto menor sea el conjunto, será mejor. Es factible demos¬ 
trar que el conjunto generador más pequeño posible debe ser linealmente independiente. 

Una base de un subespacio H de R" es un conjunto linealmente independiente en H, 
que genera a H. 

EJEMPLO 5 Las columnas de una matriz invertible de n x n forman una base para toda 
R" ya que son linealmente independientes y generan R", de acuerdo con el teorema de la 
matriz invertible. Una matriz de este tipo es la matriz identidad de n x n. Sus columnas 
se denotan mediante ei,..., e„: 



" 1 " 


"0" 


"0" 

ei = 

0 

. e 2 = 

1 

, • • • 5 C/2 - 

0 


0 


0 


1 


El conjunto { ei,_, e„¡ es la base estándar para R". Véase la figura 3. ■ 


2 El contraste entre Nul A y Col A se analiza con mayor detalle en la sección 4.2. 
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El siguiente ejemplo muestra que el procedimiento estándar para escribir el conjunto 
solución de Ax = 0 en la forma vectorial paramétrica en realidad identifica una base para Nul 
A. Este hecho se utilizará en todo el capítulo 5. 


EJ EM PLO 6 Encuentre una base para el espacio nulo de la matriz 


A = 



6 -1 
-2 2 
-4 5 



SOLUCIÓN Primero, escriba la solución de Ax = 0 en forma vectorial paramétrica: 


[A 0] 


1-2 0-1 3 0 
0 0 1 2-2 0 
0 0 0 0 0 0 


X\ — 2 x 2 — xa 4 - 3 x 5 = 0 

X3 + 2.X4 — 2X5 = 0 

0 = 0 


La solución general es x\ = 2x2 + X 4 — 3 x 5 , x 3 = — 2 x 4 + 2 x 5 , con X 2 , X 4 y X 5 libres. 


Xi 


2 X 2 + x 4 — 3 X 5 


"2" 


r 


■- 3 " 

X 2 


x 2 


1 


0 


0 

x 3 

= 

— 2 X 4 + 2x5 

= *2 

0 

+ X4 

-2 

+ x 5 

2 

X4 


X4 


0 


1 


0 

*5 


x 5 


0 


0 


1 


t t t 

u y w 

= X2U + X4V + X5W 


(i) 


La ecuación (1) indica que Nul A coincide con el conjunto de todas las combinaciones li¬ 
neales de u, v y w. Es decir, {u, v, w} genera Nul A. De hecho, esta construcción de u, v 
y w automáticamente las hace linealmente independientes, ya que ( 1 ) muestra que 0 = X 2 U + 
X4V + X5W solamente si todos los pesos X2, X4 y X5 son cero. (Examine las entradas 2 , 4 y 5 
del vector X2U + X4V + X5W). Así, ¡u, v, w} es una base para Nul A. ■ 


Encontrar una base para el espacio columna de una matriz, en realidad, representa menos 
trabajo que encontrar una base para el espacio nulo. Sin embargo, el método requiere cierta 
explicación. Comencemos con un caso sencillo. 


EJEMPLO 7 Encuentre una base para el espacio columna de la matriz 

" 1 0 -3 5 0" 

0 1 2-1 0 

B ~ 0 0 o o 1 

0 0 0 0 0 


SOLUCIÓN Denote las columnas de B mediante b¡.bs y observe que bí = — 3b 1 + 2b2, 

y que b 4 = 5b 1 — I 12 . El hecho de que b 3 y b 4 sean combinaciones de las columnas pivote 
significa que cualquier combinación de bi,..., bs es en realidad solo una combinación de bi, 
b 2 y bs. Efectivamente, si v es cualquier vector en Col B , por ejemplo. 


V — Cibi + C2b2 + C3b3 + C4b4 + C5b 5 


entonces, al sustituir b 3 y b 4 , se puede escribir v en la forma 

v = cibi + C 2 b 2 + C 3 (—3bi + 2 b 2 ) + C 4 ( 5 bi — b 2 ) + csbs 


que es una combinación lineal de bi, b 2 y b> Así, {bi, b 2 , bs] genera Col B. También, bi, b 2 
y bs son linealmente independientes, porque son columnas de una matriz identidad. Por lo 
tanto, las columnas pivote de B forman una base para Col B. ■ 
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La matriz B del ejemplo 7 está en forma escalonada reducida. Para manejar una matriz 
general A, recuerde que las relaciones de dependencia lineal entre las columnas de A se pue¬ 
den expresar en la forma Ax = 0 para alguna x. (Si algunas columnas no intervienen en una 
relación de dependencia particular, entonces las entradas correspondientes de x son cero). 
Cuando A se reduce por filas a la forma escalonada B, las columnas cambian en forma drás¬ 
tica, pero las ecuaciones Ax = 0 y Bx = 0 tienen el mismo conjunto de soluciones. Es decir, 
las columnas de A tienen exactamente las mismas relaciones de dependencia lineal que las 
columnas de B. 


EJEMPLO 8 Es posible comprobar que la matriz 


A = [ ai a 2 • • • a 5 ] = 


1 3 3 

-2 -2 2 

2 3 0 

3 4-1 


2 

-8 

7 

11 


-9 

2 

1 


-8 


es equivalente por filas a la matriz B del ejemplo 7. Encuentre una base para Col A. 

SOLUCION A partir del ejemplo 7, las columnas pivote de A son las columnas 1, 2 y 5. Tam¬ 
bién, bí = — 3bj + 2b 2 y b 4 = 5bi — b 2 . Puesto que las operaciones de fila no afectan las 
relaciones de dependencia lineal entre las columnas de la matriz, deberíamos tener que 


a 3 = —3ai + 2a 2 y a 4 = 5a¡ — a 2 


Compruebe que ¡esto es cierto! Por el argumento del ejemplo 7, a 3 y a 4 no son necesarias 
para generar el espacio columna de A. Además, {ai, a 2 , as ¡ debe ser linealmente independien¬ 
te, ya que cualquier relación de dependencia entre ai, a 2 y as implicaría la misma relación 
de dependencia entre bi, b 2 y bs. Puesto que { bi, b 2 , bs} es linealmente independiente, 
{a¡, a 2 , as i también lo es y, por lo tanto, es una base para Col A. ■ 

El argumento del ejemplo 8 se puede adaptar para demostrar el siguiente teorema. 


TEOREMA 13 


Las columnas pivote de una matriz A forman una base para el espacio columna de A. 


Advertencia: Tenga cuidado de utilizar las columnas pivote de la misma A para la base de 
Col A. Con frecuencia, las columnas de una forma escalonada B no están en el espacio co¬ 
lumna de A. (Como se observa en los ejemplos 7 y 8, todas las columnas de B tienen ceros 
en sus últimas entradas y no pueden generar las columnas de A). 


PROBLEMAS DE PRACTICA 



1 

-1 

5" 


~-7~ 

1. Sea A = 

2 

0 

7 

yu = 

3 


-3 

-5 

-3 


2 


Justifique sus respuestas. 


2. Dada A = 


0 1 0 
0 0 1 
0 0 0 


.; Está u en Nul A? /.Está u en Col A? 


, encuentre un vector en Nul A y un vector en Col A. 


3. Suponga que una matriz A de n x n es invertible. ¿Qué se puede decir acerca de Col A? 
¿Y de Nul A? 
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2.8 EJERCICIOS 


En los ejercicios 1 a 4 se muestran conjuntos en IR 2 . Suponga que 
los conjuntos incluyen las líneas de frontera. En cada caso, dé una 
razón específica por la cual el conjunto H no es un subespacio de IR 2 . 
(Por ejemplo, encuentre dos vectores en H cuya suma no esté en H, 
o encuentre un vector en H con un múltiplo escalar que no esté en H. 
Trace un dibujo). 

1 . 


7. Sean 



2~ 


"-3“ 


~-4~ 

Vi = 

-8 

, v 2 = 

8 

, V 3 = 

6 


6_ 


-7 


-7 


6" 





p = 

-10 

y a = 

[vi v 2 v 3 ]. 



11 






a) ¿Cuántos vectores hay en {vi, V2, V3}? 

b) ¿Cuántos vectores hay en Col A? 

c) ¿Está p en Col A? ¿Por qué? 

8. Sean 


Vi = 

1 

<N O 

1 

1_ 

, v 2 = 

'-2" 

3 

, v 3 = 

0" 

-5 


L 6 1 


3 


5 


2 . 




'-6' 


y p = 

1 

17 


. Determine si p está en Col A, donde A = 

J 

[Vi V 2 V3J, 

9. Con A y p como en el ejercicio 7, determine si p está en Nul A. 


10. Con u = 


y A como en el ejercicio 8, determine si u 


está en Nul A. 


En los ejercicios 11 y 12, dé enteros p y q tales que Nul A sea un 
subespacio de IR P y Col A sea un subespacio de IR ? . 


11. A = 


12. A = 


3 2 1-5 

-9-4 1 7 

9 2-51 


1 2 3' 

4 5 7 

-5 -1 0 

2 7 11 

3 3 4 



r n 


'-2" 


r-3i 

5. Sean v 3 = 

1 

1 

1_ 

, V 2 = 

-3 

7 

y w = 

1 

co 0 

1 - 
_l 


. Determine 

si w está en el subespacio de IR 3 generado por y V2. 

6 . Sean vi = 

-r 
_ 7 

. Determine si u está en el subespacio de IR 4 gene- 

2 _ 

rado por {vi, V2, V3}. 


13. Para A como en el ejercicio 11, encuentre un vector diferente de 
cero en Nul A y un vector diferente de cero en Col A. 

14. Para A como en el ejercicio 12, encuentre un vector diferente 
de cero en Nul A y un vector diferente de cero en Col A. 

Determine cuáles conjuntos de los ejercicios 15 a 20 son bases para 
IR 2 o IR 3 . Justifique sus respuestas. 


1" 


4“ 


5" 

-3 

2 

, V 2 = 

-4 

5 

, v 3 = 

-3 

6 

3 


7 


5 


15. 


17. 


19. 



' 16' 

’ 

_ —3 _ 


0" 


'5“ 


'6' 

0 

, 

0 

, 

3 

-2 


4 


2 

3" 


r e 

1 


-8 


2 


1 


-5 



16. 


18. 


4 

-10 



3" 


5' 

, 

-1 

, 

1 


2 


-4 


20 . 


1 

-6 

-7 
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En los ejercicios 21 y 22 marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. 

21. a) Un subespacio de IR" es cualquier conjunto H tal que: i. el 

vector cero está en H, ii. u, v y u + v están en H. y iii. c es 
un escalar y cu está en H. 

b) Si Vi,..., \ p están en IR", entonces Gen {vi,..., \ p } es el 
mismo que el espacio columna de la matriz [vi • • • v p ]. 

c) El conjunto de todas las soluciones de un sistema de m 
ecuaciones homogéneas con n incógnitas es un subespacio 
de IR'". 

d ) Las columnas de una matriz invertible de n x n forman una 
base para IR". 

e) Las operaciones de fila no afectan las relaciones de depen¬ 
dencia lineal entre las columnas de una matriz. 

22. a) Un subconjunto H de IR" es un subespacio si el vector cero 

está en H. 

b) Si B es la forma escalonada de una matriz A, entonces las 
columnas pivote de B forman una base para Col A. 

c ) Dados los vectores Vj,..., \ p en IR", el conjunto de todas las 
combinaciones lineales de estos vectores es un subespacio 
de IR". 

d) Sea H un subespacio de IR". Si x está en H, y y está en IR", 
entonces x + y está en H. 

e) El espacio columna de una matriz A es el conjunto de solu¬ 
ciones de Ax = b. 


26. 



-3 

3 

9 

9 

-3 

6 

0 

0 


-1 

0 

-1 

-2 

0 

0 

-1 

0 


8 


2 

-4 

6 

6 

-4 

2 

0 


27. Construya una matriz A de 3 x 3 y un vector b diferente de 
cero en forma tal que b esté en Col A, pero b no sea igual que 
alguna de las columnas de A. 

28. Construya una matriz A de 3 x 3 y un vector b en forma tal 
que b no esté en Col A. 

29. Construya una matriz A de 3 x 3 no nula y un vector b diferente 
de cero en forma tal que b esté en Nul A. 

30. Suponga que las columnas de una matriz A = [ai • ■ • a p ] son 
linealmente independientes. Explique por qué [ai,..., a p ¡ es 
una base para Col A. 

En los ejercicios 31a 36, responda de manera tan amplia como sea 

posible y justifique sus respuestas. 

31. Suponga que F es una matriz de 5 x 5 cuyo espacio columna no 
es igual a IR 5 . ¿Qué se puede decir acerca de Nul F1 

32. Si B es una matriz de 7 x 7 y Col B = IR 7 , ¿qué se puede decir 
acerca de las soluciones de las ecuaciones de la forma Bx = b 
para b en IR 7 ? 


En los ejercicios 23 a 26 se presenta una matriz A y una forma escalo¬ 
nada de A. Encuentre una base para Col A y una base para Nul A. 




'4 

5 

9 

-2" 


' 1 

2 

6 

-5' 

23. 

A = 

6 

5 

1 

12 

~ 

0 

1 

5 

-6 



_ 3 

4 

8 

—3 _ 


0 

0 

0 

0 



'3 

-6 

9 

0 " 


' 1 

-2 

5 

4' 

24. 

A = 

2 

-4 

7 

2 

~ 

0 

0 

3 

6 



3 

-6 

6 

-6 


0 

0 

0 

0 


33. Si C es una matriz de 6 x 6 y Nul C es el subespacio cero, 
¿qué se puede decir acerca de las soluciones a ecuaciones de 
la forma Cx = b para b en IR 6 ? 

34. ¿Qué se puede decir acerca de la forma de una matriz A de 
m x n cuando las columnas de A forman una base para IR'"? 

35. Si B es una matriz de 5 x 5 y Nul B no es el subespacio cero, 
¿qué se puede decir acerca de Col B1 

36. ¿Qué se puede decir acerca de Nul C cuando C es una matriz de 
6x4 con columnas linealmente independientes? 


25. A = 


1 

-1 

-2 

3 


1 

0 

0 

0 


4 8-3-7 

2 7 3 4 
2 9 5 5 
6 9-5-2 

4 8 0 5~ 

2 5 0 -1 

0 0 14 

0 0 0 0 


[M] En los ejercicios 37 y 38, construya bases para el espacio colum¬ 
na y para el espacio nulo de la matriz A dada. Justifique su trabajo. 


37. A = 


38. A = 


3 

-7 

-5 

3 

5 

4 

5 
-7 


-5 0-1 3 

9-4 9 -11 

7-2 5-7 

-7-3 4 0 

3 2-6-8 

1 3-8-7 

1 4 5 19 

-5-2 8 5 


WEB Espacio columna y espacio nulo 


WEB Una base para Col A 
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SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Para determinar si u está en Nul A, simplemente calcule 



'1-1 5" 

'-7' 


~0~ 

Au = 

2 0 7 

3 

= 

0 


-3 -5 -3 

2 


0 


El resultado indica que u está en Nul A. Para decidir si u está en Col A se requiere más 
trabajo. Reduzca la matriz aumentada [A u] a la forma escalonada para determinar si 
la ecuación Ax = u es consistente: 


1 

-1 

5 

-7 


"1 

-1 

5 

-7 


" 1 

-1 

5 

-7" 

2 

0 

7 

3 

~ 

0 

2 

-3 

17 

~ 

0 

2 

-3 

17 

-3 

-5 

-3 

2 


0 

-8 

12 

-19 


0 

0 

0 

49 


La ecuación Ax = u no tiene solución, por lo tanto, u no está en Col A. 

2. En contraste con el problema de práctica 1, encontrar un vector en Nul A requiere más 
trabajo que probar si un vector específico está en Nul A. Sin embargo, como A ya está en 
forma escalonada reducida, la ecuación Ax = 0 indica que si x = (x\, X 2 , X 3 ), entonces 
Xi = 0, a '3 = 0. y x\ es una variable libre. Por lo tanto, una base para Nul A es v = (1, 
0, 0). Encontrar solo un vector en Col A es trivial, puesto que cada columna de A está 
en Col A. En este caso particular, el mismo vector v se encuentra tanto en Nul A como en 
Col A. Para la mayoría de las matrices de n x n, el vector cero de IR" es el único vector 
que se encuentra tanto en Nul A como en Col A. 

3. Si A es invertible, entonces las columnas de A generan IR", de acuerdo con el teorema 
de la matriz invertible. Por definición, las columnas de cualquier matriz siempre gene¬ 
ran el espacio columna, así que, en este caso, Col A es toda de IR". En forma simbólica, 
Col A = IR". Además, como A es invertible, la ecuación Ax = 0 tiene únicamente la 
solución trivial. Esto significa que Nul A es el subespacio cero. En forma simbólica, 
Nul A= ¡0}. 


2.9 DIMENSIÓN Y RANGO 

En esta sección se continúa el análisis de los subespacios y las bases para subespacios comen¬ 
zando con el concepto de un sistema coordenado. La definición y el ejemplo presentados a 
continuación pretenden que un término nuevo y útil, dimensión, parezca bastante natural, al 
menos para los subespacios de IR 3 . 


Sistemas coordenados 

La razón principal para seleccionar la base de un subespacio H, en lugar de simplemente un 
conjunto generador, es que cada vector en H se puede escribir solo de una manera como com¬ 
binación lineal de los vectores de la base. Para ver por qué, suponga que B = {l»i, b p | es 
una base de H, y que un vector x en H se puede generar de dos maneras, por ejemplo, 

x = cibi + ••• + Cpbp y x = d\b\ + ••• + d p b p (1) 

Después, al restar se obtiene 

0 = x — x = (ci — d\)b\ + ■■■ + (c p — dp)b p (2) 

Como B es linealmente independiente, los pesos en (2) deben ser todos cero. Es decir, c¡ = dj 
para 1 < _/ < p, lo que indica que las dos representaciones en (1), en realidad, son iguales. 
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DEFINICIÓN 


Suponga, que el conjunto B = { bj, b /; ¡ es la base de un subespacio H. Para cada 
x en //, las coordenadas de x respecto de la base B son los pesos ci,..., c p tales 
que x = cibi + • • • + c p b p , y el vector en R 7 ’ 


c i 


M B = 


c p 


se llama vector de coordenadas de x (respecto de B) o vector de £>-coordenadas 
de x. 1 



~3~ 


-1 


3" 

EJEMPLO 1 Sea Vi = 

6 

, y 2 = 

0 

, x = 

12 


2 


1 


7 


{Vi, V 2 }. Entonces B 


es una base de H = Gen {Vi, V 2 } porque v¡ y V 2 son linealmente independientes. Determine 
si x está en H y, si lo está, encuentre el vector de coordenadas de x respecto de B. 

SOLUCION Si x está en H, entonces la siguiente ecuación vectorial es consistente: 


c 1 

"3 

6 

+ C2 

"-1" 

0 

_ 

3 " 

12 


2 


1 


7 


Los escalares C\ y C 2 , si existen, son las £>-coordenadas de x. Usando operaciones de fila, 
se tiene que 


"3 

-1 

3 


" 1 

0 

2" 

6 

0 

12 


0 

1 

3 

2 

1 

7 


0 

0 

0 


. La base B determina un “sistema de coordena¬ 
das” en H, lo que puede visualizarse por medio de la malla que se ilustra en la figura 1. ■ 


Por lo tanto, ci = 2, C 2 = 3 y [ x ] g = 



FIGURA 1 Un sistema de coordenadas sobre un 
plano H en IR 3 . 


1 Es importante que los elementos de B estén numerados, ya que las entradas de [x]g dependen del orden de los 
vectores en B. 
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DEFINICIÓN 


DEFINICIÓN 


Observe que a pesar de que los puntos de H también se encuentran en R 3 , están comple¬ 
tamente determinados por sus vectores de coordenadas, los cuales pertenecen a R 2 . La malla 
en el plano de la figura 1 hace que H “se vea” como R 2 . La correspondencia x hh> [x]g es una 
correspondencia uno a uno entre H y R 2 que conserva las combinaciones lineales. A una co¬ 
rrespondencia de este tipo se le llama isomorfismo, y se dice que H es isomorfo a R 2 . 

En general, si B = { b i,..., b ;) ¡ es una base para H, entonces el mapeo x [x]ges una co¬ 
rrespondencia uno a uno que permite a H verse y actuar igual que R p (aunque los propios vec¬ 
tores de //puedan tener más de p entradas). (En la sección 4.4 se presentan más detalles). 

Dimensión de un subespacio 

Es posible demostrar que si un subespacio H tiene una base de p vectores, entonces cualquier 
base de H debe consistir en exactamente p vectores. (Véase los ejercicios 27 y 28). Por lo 
tanto, la siguiente definición tiene sentido. 


La dimensión de un subespacio H diferente de cero, que se denota mediante dim H, es 
el número de vectores en cualquier base para H. La dimensión del subespacio cero {0} 
es, por definición, cero. 2 


El espacio R" tiene dimensión n. Cada base para R" consiste en n vectores. Un plano 
a través de 0 en R 3 es bidimensional, y una recta que pasa a través de 0 es unidimensional. 

EJEMPLO 2 Recuerde que el espacio nulo de la matriz A vista en el ejemplo 6, sección 
2.8, tenía una base de tres vectores. Así que la dimensión de Nul A en este caso es 3. Observe 
cómo cada vector básico corresponde a una variable libre en la ecuación Ax = 0. La cons¬ 
trucción realizada aquí siempre produce una base de este modo. Así, para encontrar la dimen¬ 
sión de Nul A, basta con identificar y contar el número de variables libres en Ax = 0. ■ 


El rango de una matriz A, que se denota como rango A, es la dimensión del espacio 
columna de A. 


Puesto que las columnas pivote de A forman una base para Col A, el rango de A es sim¬ 
plemente el número de columnas pivote en A. 

EJEMPLO 3 Determine el rango de la matriz 


-3 

-4 

-5 

6 


SOLUCIÓN Reduzca A a la forma escalonada: 


"2 

5 

-3 

-4 

8 


"2 

5 

-3 

-4 

8 " 

0 

-3 

2 

5 

-7 


0 

-3 

2 

5 

-7 

0 

-6 

4 

14 

-20 


0 

0 

0 

4 

-6 

0 

-9 

6 

5 

-6 


0 

0 

0 

0 

0 


Columnas pivote —í-L- 


La matriz A tiene 3 columnas pivote, así que rango A = 3. 


2 El subespacio cero no tiene base (porque el vector cero forma, por sí mismo, un conjunto linealmente depen¬ 
diente). 
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TEOREMA 14 


TEOREMA 15 


TEOREMA 


La reducción por filas del ejemplo 3 revela que hay dos variables libres en Ax = 0, por¬ 
que dos de las cinco columnas de A no son columnas pivote. (Las columnas que no son pivote 
corresponden a las variables libres de Ax = 0). Como el número de columnas pivote más el 
número de columnas que no son pivote es exactamente el número de columnas, las dimensio¬ 
nes de Col A y Nul A guardan la siguiente relación útil. (Para más detalles, véase el teorema 
del rango en la sección 4.6). 


El teorema del rango 

Si una matriz A tiene n columnas, entonces rango A + dim Nul A = n. 


El siguiente teorema es importante para las aplicaciones y se necesitará en los capítulos 
5 y 6. El teorema (demostrado en la sección 4.5) es verdaderamente superior, si se piensa en 
un subespacio /^-dimensional como isomorfo a RC El teorema de la matriz invertible estable¬ 
ce que p vectores de R p son linealmente independientes si y solo si también generan a IRC 


El teorema de la base 

Sea H un subespacio /^-dimensional de R". Cualquier conjunto linealmente indepen¬ 
diente de exactamente p elementos en H de forma automática es una base de //. Ade¬ 
más, cualquier conjunto de p elementos de H que genere a H es automáticamente una 
base para H. 


Rango y el teorema de la matriz invertible 

Los diversos conceptos de espacio vectorial asociados con una matriz proporcionan varios 
enunciados más para el teorema de la matriz invertible. Estos enunciados se presentan como 
una continuación del teorema original presentado en la sección 2.3. 


El teorema de la matriz invertlble (continuación) 

Sea A una matriz de n x n. En tal caso, cada uno de los siguientes enunciados es equi¬ 
valente al enunciado de que A es una matriz invertible. 

m) Las columnas de A forman una base de R". 

n ) Col A = R" 

o) dim Col A = n 

p) rango A = n 

q) Nul A = ¡0} 

r) dim Nul A = 0 


DEMOSTRACIÓN El enunciado ni) es, por lógica, equivalente a los enunciados e) y h) que 
consideran independencia lineal y generación. Los otros cinco enunciados se vinculan a los 
primeros del teorema por medio de la siguiente cadena de implicaciones casi triviales. 

g) => «) => o) => p) => r) => q) => d) 

El enunciado g), que establece que la ecuación Ax = b tiene al menos una solución para cada 
b en R", implica al enunciado rí), porque Col A es precisamente el conjunto de todas las b 
tales que la ecuación Ax = b sea consistente. Las implicaciones n) => o)=> p) se desprenden 
de las definiciones de dimensión y rango. Si el rango de A es n , el número de columnas de A, 
entonces dim Nul A = 0, de acuerdo con el teorema del rango, y así Nul A = {0}. Por lo tanto. 
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p) =4* r) => í/). Además, el enunciado q) implica que la ecuación Ax = 0 tiene únicamente la 
solución trivial, que es el enunciado d). Puesto que ya se sabe que los enunciados d) y g) son 
equivalentes al enunciado de que A es invertible, la prueba está completa. ■ 



- NOTAS NUMÉRICAS - 

Muchos de los algoritmos analizados en este libro resultan útiles para entender concep¬ 
tos y realizar a mano cálculos sencillos. Sin embargo, con frecuencia los algoritmos no 
son aplicables a problemas de gran escala en la vida real. 

Un buen ejemplo de lo anterior es la determinación del rango. Tal vez parezca 
sencillo reducir una matriz a su forma escalonada y contar los pivotes. Pero, a menos 
que se realicen cálculos matemáticos precisos sobre una matriz cuyas entradas estén 
especificadas de manera exacta, las operaciones de fila pueden cambiar el rango apa- 

[5 71 

rente de una matriz. Por ejemplo, si el valor de .r en la matriz ^ no se almace¬ 

na exactamente como 7 en una computadora, entonces el rango puede ser 1 o 2, depen¬ 
diendo de si la computadora considera a x — 7 como cero. 

En las aplicaciones prácticas, es frecuente que el rango efectivo de una matriz A 
se determine a partir de la descomposición del valor singular de A, que se estudiará en 
la sección 7.4. 


PROBLEMAS DE PRÁCTICA 

1. Determine la dimensión del subespacio H de generado por los vectores Vi, V2 y V3. 
(Primero, encuentre una base para H). 



3. ¿Podría R J contener un subespacio cuatridimensional (o tetradimensional)? Explique su 
respuesta. 
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_ _ . T31 u [-1~\ T 71 [4' 

7. Sean bi= Q , b 2 = ? , w = , x = 1 y 

B = {bi, b 2 }. Use la figura para estimar [w]g y [x]g. Confir¬ 
me su estimación de [x]g usándola junto con {bi, b 2 ) para 
calcular x. 



rol f 21 f -21 f 2 " 

S. Sean bi = 2 , b 2 = j , x = y = 4 , 

z = 2 ^ y B = { bi, b 2 }. Use la figura para estimar 

[x]g, [y]g y [z]g. Confirme sus estimaciones de [y]g y [z]g 
usándolas junto con {bi, b 2 ) para calcular y y z. 




En los ejercicios 9 a 12 se presenta una matriz A y una forma escalo¬ 
nada de A. Encuentre bases para Col A y Nul A, y después establezca 
las dimensiones de estos subespacios. 


9 . A = 


10 . A = 


13 2-6 

3 9 15 

2 6-1 9 ~ 

5 15 0 14J 

1- 2-1 5 4 

2- 1156 

-2 0-2 1 -6 

3 14 15 

1 - 2-1 2 0 " 
0 110 3 

0 0 0 1 0 
0 0 0 0 1 



' 1 

3 

3 

2' 


0 

0 

5 

-7 


0 

0 

0 

5 


0 

0 

0 

0 


11 . A = 


4-5 2-3 


12 . A = 


-6 

-7 

-3 

-1 

2 

-5 

1 

-4 

0 

5 

0 

5 

0 

0 

0 

0 

0 

0 

0 

0 

2 

-4 

4 

6 

1 

-9 

2 

10 

6 

-9 

12 

15 

4 

-5 

8 

9 

2 

8 

4 

-6 

2 

3 

4 

-1 

0 

5 

0 

-5 

0 

0 

0 

0 


En los ejercicios 13 y 14, encuentre una base para el subespacio que 
generan los vectores dados. ¿Cuál es la dimensión del subespacio? 


15 . Suponga una matriz A de 4 x 6 tiene cuatro columnas pivote. 
¿Es Col A = IR 4 ? ¿Es Nul A = IR 2 ? Explique sus respuestas. 

16 . Suponga una matriz A de 4 x 7 tiene tres columnas pivote. ¿Es 
Col A = IR 3 ? ¿Cuál es la dimensión de Nul A? Explique sus 
respuestas. 

En los ejercicios 17 y 18, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. Aquí A es una matriz de m x n. 

17 . a) Si B — {vi, ..., \p) es una base para un subespacio H, y si 

x = civi + ••• + CpXp , entonces ci,..., c p son las coordena¬ 
das de x respecto de la base B. 

b) Cada recta en IR" es un subespacio unidimensional de IR". 

c) La dimensión de Col A es el número de columnas pivote 
de A. 

d) Las dimensiones de Col A y Nul A suman el número de co¬ 
lumnas de A. 

e) Si un conjunto de p vectores generan un subespacio p-di- 
mensional H de IR", entonces estos vectores forman una base 
para H. 

18 . a) Si B es una base para un subespacio H , entonces cada vector 

en H se puede escribir solamente de una forma como combi¬ 
nación lineal de los vectores en B. 

b) La dimensión de Nul A es el número de variables en la ecua¬ 
ción Ax = 0. 

c) La dimensión del espacio columna de A es rango A. 
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d) Si B = {vi,..., v p } es una base del subespacio H de IR", 
entonces la correspondencia x « [x]g hace que H sea vea 
y actúe como IRC 

e) Si H es un subespacio p-dimensional de R", entonces un con¬ 
junto linealmente independiente de p vectores en H es una 
base para H. 

En los ejercicios 19 a 24 justifique cada respuesta o construcción. 

19 . Si el subespacio de todas las soluciones de Ax = 0 tiene una 
base que consiste en tres vectores, y si A es una matriz de 5x7, 
¿cuál es el rango de A? 

20 . ¿Cuál es el rango de una matriz de 6 x 8 cuyo espacio nulo es 
tridimensional? 

21 . Si el rango de una matriz A de 9 x 8 es 7, ¿cuál es la dimensión 
del espacio solución de Ax = 0? 

22 . Demuestre que un conjunto {vi,..., V 5 } en IR" es linealmente 
dependiente si dim Gen [vi,..., V 5 } =4. 

23 . Si es posible, construya una matriz A de 3 x 5 tal que dim 
Nul A = 3 y dimColA = 2. 

24 . Construya una matriz de 3 x 4 con rango 1. 

25. Sea A una matriz den x p cuyo espacio columna es p-dimensio¬ 
nal. Explique por qué las columnas de A deben ser linealmente 
independientes. 

26 . Suponga que las columnas 1, 3, 4, 5 y 7 de una matriz A son 
linealmente independientes (pero no son necesariamente co¬ 
lumnas pivote), y que el rango de A es 5. Explique por qué las 
cinco columnas mencionadas deben ser una base para el espacio 
columna de A. 


27 . Suponga que los vectores bi,..., b p generan un subespacio W, 

y sea ¡ai,..., a^} cualquier conjunto en W que contenga más de 
p vectores. Complete los detalles del siguiente argumento para 
demostrar que ¡ai...., a q ) debe ser linealmente dependiente. 
Primero, sea B = [bi b p ]yA=[ai ••• a q ]. 

a) Explique por qué para cada vector a,-, existe un vector c¡ en 
IR p tal que a,- = Bc¡. 

b) Sea C = [Ci ••• c 9 ]. Explique por qué existe un vector 

diferente de cero tal que Cu = 0. 

c) Utilice B y C para demostrar que Au = 0. Esto muestra que 
las columnas de A son linealmente dependientes. 

28 . Use el ejercicio 27 para demostrar que si A y B son bases 
para un subespacio IV de IR", entonces A no puede contener 
más vectores que B y, a la inversa, que B no puede conte¬ 
ner más vectores que A. 

29. [M] Sean H = Gen {vi, V 2 ), y B = {\q, v 2 ). Demuestre que 
x está en H, y encuentre el vector de B -coordenadas de x, 
cuando 


' 15“ 


14“ 


“ 16“ 

-5 


-10 


0 

12 

, v 2 = 

13 

, X = 

11 

7 


17 


-3 


30. [M] Sean H — Gen {vi, V2, V3} y B = (vi, V2, V3}. Demuestre 
que B es una base para H y que x está en H, y encuentre el vec¬ 
tor de B -coordenadas de x, cuando 



- 6 " 


8 “ 


“-9“ 


“ 11 “ 


3 


0 


4 


-2 

Vi = 

-9 

, v 2 = 

7 

, v 3 = 

-8 

, X = 

17 


4 


-3 


3 


-8 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 




1. Construya A = [v¡ y 2 V 3 ] de manera que el subespacio generado por Vi, V 2 , V 3 sea el espa¬ 
cio columna de A. Las columnas pivote de A proporcionan una base para este espacio. 



2 

3 

- 1 “ 


“2 

3 

- 1 “ 


“2 

3 

- 1 “ 

A = 

-8 

-7 

6 

~ 

0 

5 

2 

~ 

0 

5 

2 


6 

-1 

-7 


0 

-10 

-4 


0 

0 

0 


Las primeras dos columnas de A son columnas pivote y forman una base para H. Por lo 
tanto, dim H = 2. 


2. Si [x] B = 


, entonces x se forma a partir de una combinación lineal de los vectores 


básicos usando los pesos 3 y 2: 


x = 3bi + 2 b 2 = 3 

La base {bi, b 2 } determina un sistema de coordenadas para IR 2 , que se ilustra con la 
malla de la figura. Observe cómo x tiene 3 unidades en la dirección bi y 2 unidades en 
la dirección b 2 . 


+ 2 


3.4 

2.6 
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3. Un subespacio cuatridimensional contendría una base de cuatro vectores linealmente in¬ 
dependientes. Esto es imposible en IR 3 . Como cualquier conjunto linealmente indepen¬ 
diente en R 3 no contiene más de tres vectores, cualquier subespacio de R 3 tiene una di¬ 
mensión no mayor a 3. El propio espacio R 3 es el único subespacio tridimensional de R 3 . 
Los otros subespacios de R 3 tienen dimensión 2, 1 o 0. 
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1. Suponga que las matrices mencionadas en los siguientes enun¬ 
ciados tienen los tamaños adecuados. Marque cada enunciado 
como verdadero o falso. Justifique sus respuestas. 

a) Si A y B son de m x n, entonces tanto AB T como A T B están 
definidas. 

b) Si AB = C y C tiene dos columnas, entonces A tiene dos 
columnas. 

c) Al multiplicar por la izquierda una matriz B por una matriz 
diagonal A, con entradas distintas de cero en la diagonal, se 
modifica la escala de las filas de B. 


6 . 


Sea A = 


1 

0 


B = 


1 

0 


. Estas son matrices 


ele 


espín de Pauli y se usan en el estudio del espín de electrones en 
mecánica cuántica. Demuestre que A 2 = 7. B 2 = 1 y AB = —BA. 
Las matrices del tipo AB = —BA se llaman anticonmutativas. 



' 1 

3 

8" 


'-3 

5' 

7. Sea A = 

2 

4 

11 

y b = 

1 

5 


1 

2 

5 


3 

4 


Calcule A 'B 


sin calcular A 1 . [Sugerencia: A l B es la solución de la ecua¬ 
ción AX = B], 


d) Si BC = BD. entonces C = D. 

e) Si AC = 0, entonces A = 0 o C = 0. 

f) Si A y B son de n x n, entonces (A + B)(A — B) = A 2 — B 2 . 

g) Una matriz elemental den x n tiene n o n + 1 entradas 
diferentes de cero. 

h) La transpuesta de una matriz elemental es una matriz ele¬ 
mental. 

i) Una matriz elemental debe ser cuadrada. 


8 . 


9. 

10 . 


Encuentre una matriz A tal que la transformación x i-» Ax 

1, respectivamente. [Suge¬ 



■ i ' 


'2" 


■ i' 


'3' 

mapee 

_ 3 _ 

y 

1 _ 

en 

i 

y 

1 


rencia: Escriba una ecuación de matrices que implique a A, y 
despeje A], 


Suponga que AB = 


5 

-2 


y b = 


Encuentre A. 


Suponga que A es invertible. Explique por qué A T A también es 
invertible. Después demuestre que A -1 = (Á r A)~ 1 A T . 


j) Toda matriz cuadrada es un producto de matrices elemen¬ 
tales. 


k) Si A es una matriz de 3 x 3 con tres posiciones pivote, exis¬ 
ten matrices elementales E\,...,E p tales que E p --- £jA = 1. 

l) Si AB = /, entonces A es invertible. 

m) Si A y B son cuadradas e invertibles, entonces AB es inverti¬ 
ble, y (AB)-' = A-'B 

n) Si AB = BA y A es invertible, entonces A _1 7? = BA~ l . 

o) SiA es invertible y r A 0, entonces (rA) -1 = rA '. 


p ) Si A es una matriz de 3 x 3 y la ecuación Ax = 


1 

0 

0 


tiene 


una sola solución, entonces A es invertible. 


2. Encuentre la matriz C cuya inversa es C 1 = 


4 5 

6 7 


3. Sea A = 


0 0 0 
1 0 0 
0 1 0 


. Demuestre que A 3 = 0. Utilice álge¬ 


bra de matrices para calcular el producto (7 — A)(/ + A + A 2 ). 


4. Suponga que A” = 0 para alguna n > 1. Encuentre una inversa 
para I — A. 


5. Suponga que una matriz A de n x n satisface la ecuación 
A 2 — 2A + / = 0. Demuestre que A 3 = 3A — 21, y que A 4 = 
4A - 37. 


11. Sean jti,..., x„ números fijos. La siguiente matriz, llamada una 
matriz de Vandermonde, se presenta en aplicaciones como pro¬ 
cesamiento de señales, códigos correctores de errores e interpo¬ 
lación de polinomios. 



' 1 

x¡ 

*1 ■ 

y.n— 1 
x \ 

V = 

1 

*2 

x\ 

x n ~ i 


1 

x„ 

X 1 

v n—1 
X n _ 


A partir de y = (y \,..., y n ) en IR", suponga que c = (co,..., c„-i) 
en R" satisface Ve = y, y defina el polinomio 

p(t) — co + cp + C 2 Í 2 + ••• + 

a) Demuestre que p(x{) = p(x„) = y„. Denominamos a 

p(t) un polinomio de interpolación para los puntos (jci. Vi),..., 
(-*«, y») porque la gráfica de p(t) pasa por estos puntos. 

b) Suponga que x\,. ,., x„ son números distintos. Demuestre que 
las columnas de V son linealmente independientes. [Suge¬ 
rencia: Piense en cuántos ceros puede tener un polinomio de 
grado n — 1], 

c) Demuestre que: “Si *i,..., x,„ son números distintos yi,..., 
y n son números arbitrarios, entonces hay un polinomio de 
interpolación de grado —1 para (x¡, vi),..., (x„, y„)”. 

12. Sea A = LU, donde L es una matriz triangular inferior invertible 
y U es triangular superior. Explique por qué la primera columna 
de A es un múltiplo de la primera columna de L. ¿Cómo se rela¬ 
ciona la segunda columna de A con las columnas de L? 
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13. Dada u en R" con u r u = 1, sea P = uu r (un producto exterior) 
y Q = 1 — 2 P. Justifique los enunciados a), b ) y c). 

a) P 2 = P b) P T =P c) Q 2 = I 


La transformación x i-> Px es una proyección , yxo Qx se 
llama reflexión de Householder. Dichas reflexiones se usan 
en programas de computadora para crear múltiples ceros en un 
vector (por lo general, una columna de una matriz). 



" 0 ~ 


' 1 ' 

14. Sean u = 

0 

y x = 

5 


1 


3 


Determine P y Q como en el 


ejercicio 13, y calcule Px y Qx. La figura muestra que Qx es 
la reflexión de x a través del plano X\X 2 - 



Una reflexión de Householder a través del 
plano x 3 = 0 . 


15. Suponga que C = donde £j, E 2 y £3 son matrices 

elementales. Explique por qué C es equivalente por filas a B. 

16. Sea A una matriz singular de n x n. Describa cómo se puede 
construir una matriz B de n x n no nula tal que AB = 0. 

17. Sean A una matriz de 6 x 4 y B una matriz de 4x6. Demuestre 
que la matriz AB de 6 x 6 no puede ser invertible. 

18. Suponga que A es una matriz de 5 x 3 y que existe una matriz 
C de 3 x 5 tal que CA = I¡. Suponga además que para alguna b 
dada en R 5 , la ecuación Ax = b tiene por lo menos una solución. 
Demuestre que esta solución es única. 

19. [M] Ciertos sistemas dinámicos se pueden estudiar examinan¬ 
do las potencias de una matriz, como las que se presentan a 
continuación. Determine qué ocurre a A* y B k conforme k se 
incrementa (por ejemplo, pruebe con k = 2,..., 16). Trate de 
identificar qué tienen de especial A y B. Investigue potencias 
grandes de otras matrices de este tipo y haga una conjetura acer¬ 
ca de dichas matrices. 



' .4 

.2 

.3" 


' 0 

.2 

.3' 

A = 

.3 

.6 

.3 

, B = 

.1 

.6 

.3 


.3 

.2 

.4 


.9 

.2 

.4 


20. [M] Sea A„ una matriz de n x n con ceros en la diagonal prin¬ 
cipal y números 1 en el resto. Calcule A~ l para n = 4, 5 y 6 , 
y haga una conjetura acerca de la forma general de A~ ¡ para 
valores más grandes de n. 




3 

Determinantes 



EJEMPLO INTRODUCTORIO 

Trayectorias aleatorias y distorsión 

En su libro autobiográfico ¿Está usted de broma, Sr. Feynman?, 
el Premio Nobel de Física 1965, Richard P. Feynman, comen¬ 
ta que en su estancia universitaria de posgrado en Princeton 
solía observar a las hormigas. Estudió su comportamiento al 
proporcionarles un “transbordador” de pedazos de papel que 
podía trasladarlas hacia el terrón de azúcar que colgaba de 
una cuerda, donde las hormigas jamás podrían encontrarlo 
accidentalmente. Cuando una hormiga se paraba sobre el 
papel, entonces Feynman la transportaba hacia la comida 
y la traía de regreso al punto inicial. Después de que las 
hormigas aprendieron a utilizar el transbordador de papel, 
Feynman reubicó el punto de aterrizaje de retomo. Esto 
pronto generó confusión en la colonia de hormigas, lo que 
indicaba que el “aprendizaje” de las hormigas había consisti¬ 
do en crear y seguir rutas. Feynman confirmó esta conjetura 
colocando placas de vidrio sobre el piso. Una vez que las hor¬ 
migas establecieron mtas sobre los trozos de vidrio, Feynman 
los reacomodó y, por consiguiente, las rutas que estos indi¬ 
caban. Las hormigas siguieron las rutas reposicionadas y así 
Feynman podía dirigir a las hormigas adonde él quisiera. 

Supongamos que Feynman hubiera deseado realizar investi¬ 
gaciones adicionales utilizando im globo, fabricado con una malla 
de alambre; las hormigas deberían seguir cada alambre y elegir 
entre dirigirse a la izquierda o a la derecha en cada intersección. 

Si varias hormigas y un número igual de fuentes de alimento se 
colocan sobre el globo, ¿qué tan probable sería que cada hormiga 
encontrara su propia fuente de alimento en lugar de utilizar la ruta 
de otra hormiga y seguirla hasta una fuente compartida? 1 

1 La solución al problema de la trayectoria de las hormigas (y otras dos aplica¬ 
ciones) se puede encontrar en el artículo de Arthur Benjamín y Naomi Carne- 
ron, publicado en la edición de Mathematical Monthly, de junio 2005. 


Para registrar las rutas reales de las hormigas y 
comunicar los resultados a otros, es conveniente utilizar 
un mapa rectangular del globo. Existen muchas maneras 
de trazar dichos mapas. Una manera sencilla es utilizar la 
latitud y longitud sobre el globo como coordenadas x y y 
en el mapa. Como ocurre con todos los mapas, el resultado 
no sería una representación totalmente fiel del globo. 

Los detalles cerca del “ecuador” se ven prácticamente 
iguales tanto sobre el globo como en el mapa, pero 
las regiones cercanas a los “polos” del globo están 
distorsionadas. Las imágenes de regiones polares son 
mucho más grandes que las imágenes de regiones 
ecuatoriales de tamaño similar. Para ajustarse a sus 
alrededores en el mapa, la imagen de una hormiga cerca 
de uno de los polos debería ser más grande que la de una 
cercana al ecuador. ¿Cuánto más de grande? 

De manera sorprendente, los problemas de la trayec¬ 
toria de las hormigas y la distorsión del área se contestan 
mejor utilizando determinantes, el tema de este capítulo. 

De hecho, el determinante tiene tantos usos que un resumen 
de sus aplicaciones a principios del siglo xx ocupó cuatro 
volúmenes del tratado que escribió Thomas Muir. Ante la 
trascendencia y el tamaño crecientes de las matrices en las 
aplicaciones modernas, muchos usos de los determinantes 
que antes eran importantes ahora ya no lo son. Sin embargo, 
los determinantes aún desempeñan un papel importante. 
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Determinantes 


Además de introducir el tema de determinantes en la sección 3.1, este capítulo presenta dos 
ideas importantes. La sección 3.2 deduce, para una matriz cuadrada, un criterio de invertibili¬ 
dad que desempeña un papel importante en el capítulo 5. La sección 3.3 muestra cómo el de¬ 
terminante mide cuánto cambia una transformación lineal al área de una figura. Cuando esta 
técnica se aplica localmente, entonces se responde a la pregunta de la tasa de expansión de un 
mapa cerca de los polos. Esta idea desempeña un papel fundamental en cálculo multivariado 
en la forma del jacobiano. 


3.1 INTRODUCCIÓN A LOS DETERMINANTES 


Recuerde de la sección 2.2 que una matriz de 2 x 2 es invertible si y solo si su determinante 
es diferente de cero. Para extender este útil resultado a matrices más grandes, se necesita una 
definición para el determinante de una matriz de n x n. Se puede descubrir la definición para 
el caso 3x3 observando qué ocurre cuando una matriz invertible A de 3 x 3 se reduce por 
filas. 

ConsidereA = [a¡j\ con a ¡ ¡ A 0. Si la segunda y tercera filas de A se multiplican por ci\\, y 
luego se restan múltiplos adecuados de la primera fila de las otras dos filas, se encuentra que 
A es equivalente por filas a las dos matrices siguientes: 


«11 

«12 

«13 


«11 

«12 

«13 

«11 «21 

ail «22 

«11 «23 

~ 

0 

« 11«22 — « 12«21 

«11 «23 — « 13«21 

_ «11 « 31 

«11 «32 

«11 «33 _ 


0 

«11 «32 — « 12«31 

^ 11^33 — ^ 13^31 


Puesto que A es invertible, entonces la entrada (2, 2) o la entrada (3, 2) en el lado derecho 
de (1) es diferente de cero. Supongamos que la entrada (2, 2) es diferente de cero. (De otra 
forma, se puede realizar un intercambio de filas antes de proceder). Se multiplica la fila 3 por 
a\\ci 22 — « 12021 , y luego a la nueva fila 3 se le suma la fila 2 multiplicada por — («n «32 — «i 2 « 3 i)- 
Esto mostrará que 


donde 


A 


«n a 12 «n 

0 « 11«22 — « 12«21 « 11«23 — « 13«21 

0 0 a 11A 


A — Cl 11 « 22«33 + 012 « 23«31 + « 13«21 «32 — « 11 « 23«32 — « 12«21 «33 — « 13 « 22«31 (2) 


Puesto que A es invertible, A debe ser diferente de cero. En la sección 3.2 se verá que lo con¬ 
trario también es verdad. A A de la ecuación (2) se le llama el determinante de la matriz A 
de 3 x 3. 

Recuerde que el determinante de una matriz de 2 x 2, A = [a¡j], es el número 

detA = ana22 — «i2«2i 

Para una matriz de 1 x 1, por ejemplo, A = [an], se define det A = an. Para genera¬ 
lizar la definición del determinante a matrices más grandes, se utilizarán determinantes de 
2x2 para rescribir el determinante A de 3 x 3 descrito anteriormente. Puesto que los tér¬ 
minos en A se pueden agrupar como («j i« 22«33 — «ii«23«32) — («i2«2i«33 — «i2«23«3i) + 

(« 13 « 21«32 — « 13 « 22 « 3 lX 


"O 

5 

II 

<1 

a 22 

«23 

— an ■ det 

«21 

a 23 

+ an • det 

«21 

a 22 


«32 

«33 


«31 

«33 


«31 

«32 


Por brevedad, se escribe 

A = «11 • det An — ci 12 • det An + «n • det An (3) 

donde An, An y An se obtienen de A eliminando la primera fila y una de las tres columnas. 
Para cualquier matriz cuadrada A, sea A,y la submatriz formada al eliminar la i-ésima fila y la 
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y-ésima columna de A. Por ejemplo, si 

"1-2 5 0 

2 0 4 -1 

A ~ 3 1 0 7 

0 4-20 


entonces A 32 se obtiene eliminando la fila 3 y la columna 2, 


de manera que 



Ahora se puede dar una definición recursiva de un determinante. Cuando n = 3, det A se 
define utilizando los determinantes de las submatrices Ay de 2 x 2, como en la ecuación (3). 
Cuando n = 4, det A utiliza los determinantes de las submatrices Ay de 3 x 3. En general, un 
determinante n x n se define mediante determinantes de submatrices de {n — 1) X (n — 1). 


DEFINICION Para n > 2, el determinante de una matriz A = [ay] d en x n es la suma de n términos 
de la forma ±ay det Ay, con signos más y menos alternados, donde las entradas an, 
a 12 ,..., a 1 „ son de la primera fila de A. En símbolos, 

det A = a n det A n — a 12 det A p + ••• + (— l) l+n a ln det A ln 

n 

= ^ ( — 1 ) 1 + , « y det A y 

i= 1 


EJEMPLO 1 Calcule el determinante de 


A = 


1 

2 

0 


5 

4 

-2 


0 

-1 

0 


SOLUCION Calcule det A = a\\ det An - an det Ai 2 A ü \3 det A 


13 - 


det A = 1 • det 


4 -1 
-2 0 


— 5 • det 


2 -1 

0 0 


1(0 - 2) - 5(0 - 0) + 0(—4 - 0) 


+ 0 • det 
-2 


2 4 

0 -2 


Otra notación común para el determinante de una matriz utiliza un par de rectas verticales 
en lugar de corchetes. Así, el cálculo del ejemplo 1 se puede representar como 


det A = 1 


4 -1 
-2 0 


2 -1 

0 0 


+ 0 


2 4 

0 -2 


Para establecer el siguiente teorema, es conveniente escribir la definición de det A en 
una forma ligeramente distinta. Dada A = [í/, ; ], el cofactor (i, j) de A es el número C, ; 
definido por 

Cy = (—\) i+J det Ay (4) 

Entonces 

det A = aiiCn + anCn + • • • + 
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TEOREMA 1 


Esta fórmula se conoce como desarrollo por cofaetores a lo largo de la primera fila 

de A. Se omite la demostración del siguiente teorema fundamental para así evitar una larga 
digresión. 


El determinante de una matriz A de n x n se puede calcular mediante un desarrollo por 
cofaetores a lo largo de cualquier fila o columna. El desarrollo a lo largo de la í-ésima 
fila utilizando los cofaetores de la ecuación (4) es 

det A ¿ti i C'j i 4“ aaCa 4" 4" ci¡ n C¡ n 

El desarrollo por cofaetores a lo largo de lay-ésima columna es 

det A cijjCjj 4" Í/ 2 /C 2 / 4- ••• 4- G n jC n j 


El signo más o menos en el cofactor (i,j) depende de la posición de a¡j en la matriz, sin 
importar el signo de a¡j. El factor (—1 ) M / genera el siguiente patrón de signos: 

"+ - + 

- + - 

+ - + 


EJEMPLO 2 

el det A, donde 


Utilice un desarrollo por cofaetores a lo largo de la tercera fila para calcular 


A = 


1 

2 

0 


5 

4 

-2 


0 

-1 

0 


SOLUCIÓN Calcule 


det A — ÍZ 31 C 31 4- CI 22 C 32 + « 33 C 33 

= (— 1 ) 3 +I tf 3 i detAji 4- (—1) 3+2 «32 det A 32 4- (— l) 3+3 a 33 det A 33 

1 5 

2 4 

= 0 + 2 (-l) + 0 = -2 


= 0 


5 0 
4 -1 


-(- 2 ) 


1 0 
2 -1 


+ 0 


El teorema 1 es útil para calcular el determinante de una matriz que contiene muchos 
ceros. Por ejemplo, si en una fila hay una mayoría de ceros, entonces el desarrollo por co- 
factores a lo largo de esa fila tiene muchos términos iguales a cero, y no se necesita calcular 
los cofaetores en estos términos. El mismo enfoque funciona con una columna que contiene 
muchos ceros. 


EJEMPLO 3 Calcule det A, donde 


A = 


3-7 8 
0 2-5 
0 0 1 
0 0 2 
0 0 0 


9 

7 

5 

4 

-2 


-6 

3 

0 

-1 

0 


SOLUCIÓN El desarrollo por cofaetores a lo largo de la primera columna tiene todos los 
términos iguales a cero, excepto el primero. Así, 


det A = 3 • 


2 

0 

0 

0 


-5 

1 

2 

0 


7 3 

5 0 

4 -1 
-2 0 


— 0 ■ C 21 4- 0 • C 31 — 0 • C 41 4- 0 • C 51 
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De aquí en adelante se omitirán los términos iguales a cero en el desarrollo por cofactores. 
Después, desarrolle este determinante de 4 x 4 a lo largo de la primera columna para tomar 
ventaja de los ceros que están ahí. Se tiene 


det A = 3 ■ 2 ■ 


1 5 0 

2 4-1 
0-2 0 


Este determinante de 3 x 3 se calculó en el ejemplo 1 y se encontró que su valor es —2. 
Por lo tanto, det A = 3 • 2 • (—2) = —12. ■ 

La matriz en el ejemplo 3 era casi triangular. El método en ese ejemplo se adapta fácil¬ 
mente para demostrar el siguiente teorema. 


TEOREMA 2 


Si A es una matriz triangular, entonces det A es el producto de las entradas sobre la 
diagonal principal de A. 


La estrategia en el ejemplo 3 para detectar ceros funciona muy bien cuando una fila o 
columna completa consiste en ceros. En tal caso, el desarrollo por cofactores a lo largo de tal 
fila o columna ¡es una suma de ceros! Así, el determinante es cero. Por desgracia, la mayoría 
de los desarrollos por cofactores no son tan rápidos de evaluar. 

- NOTA NUMÉRICA - 

En la actualidad, una matriz de 25 x 25 se considera pequeña. Sin embargo, sería 
imposible calcular un determinante de 25 x 25 con un desarrollo por cofactores. En 
general, un desarrollo por cofactores requiere alrededor de ni multiplicaciones, y 25! 
es aproximadamente 1.5 x 10 25 . 

Si una computadora efectúa un billón de multiplicaciones por segundo, tendría que 
trabajar unos 500,000 años para calcular un determinante de 25 x 25 utilizando este 
método. Por fortuna, hay métodos más rápidos, como pronto se verá. 


Los ejercicios 19 a 38 exploran importantes propiedades de los determinantes, sobre todo 
para el caso de 2 x 2. Los resultados de los ejercicios 33 a 36 se utilizarán en la próxima 
sección con la finalidad de deducir propiedades análogas para matrices de n x n. 


PROBLEMA DE PRÁCTICA 


Calcule 



2 2 
0 -4 
0 3 
0 -6 


3.1 EJERCICIOS 


En los ejercicios 1 a 8 obtenga los determinantes utilizando un de¬ 
sarrollo por cofactores a lo largo de la primera fila. En los ejercicios 
1 a 4, también calcule el determinante mediante un desarrollo por 
cofactores a lo largo de la segunda columna. 


3 

0 

4 


0 

5 

1 

2 

3 

2 

2. 

4 

-3 

0 

0 

5 

-1 


2 

4 

1 


3. 


2 

-4 

3 


1 

3 

5 

3 

1 

2 

4. 

2 

1 

1 

1 

4 

-1 


3 

4 

2 


2 3-4 


5-2 4 

4 0 5 

6. 

0 3-5 

5 1 6 


2-4 7 


1 . 


5. 



168 CAPÍTULO 3 Determinantes 


4 

3 

0 


8 

1 

6 

21. 

'3 

4" 


3 

4 

6 

5 

2 

8. 

4 

0 

3 

5 

6 

’ 

5 + 3 k 

6 + 4fc _ 

9 

7 

3 


3 

-2 

5 


r i ■ 


r » 



En los ejercicios 9 a 14 calcule los determinantes mediante desarro¬ 
llo por cofactores. En cada paso, seleccione una fila o columna que 
implique la menor cantidad de operaciones. 


11 . 


13. 


6 

0 

0 

5 



1 

—2 

5 

2 

1 

7 

2 

-5 


10 . 

0 

0 

3 

0 

2 

0 

0 

0 


2 

-6 

-7 

5 

8 

3 

1 

8 



5 

0 

4 

4 

3 

5 

—8 

4 



4 

0 

0 

0 

0 

—2 

3 

-7 


12 . 

7 

-1 

0 

0 

0 

0 

1 

5 


2 

6 

3 

0 

0 

0 

0 

2 



5 

-8 

4 

-3 

4 

0 

-7 

3 

-5 






0 

0 

2 

0 

0 






7 

3 

-6 

4 

-8 






5 

0 

5 

2 

—3 






0 

0 

9 

-1 

2 






6 

3 

2 

4 

0 






9 

0 

-4 

1 

0 






8 

-5 

6 

7 

1 






3 

0 

0 

0 

0 






4 

2 

3 

2 

0 







14. 


El desarrollo de un determinante de 3 x 3 se puede recordar median¬ 
te el siguiente recurso. A la derecha de la matriz escriba una segunda 
copia de las primeras dos columnas, y calcule el determinante multi¬ 
plicando las entradas sobre las seis diagonales: 


°11 a 12 fl 13 


\AJ 

72 1 

X 


Sume los productos de las diagonales hacia abajo y reste los pro¬ 
ductos de las diagonales hacia arriba. Utilice este método para ob¬ 
tener los determinantes en los ejercicios 15 a 18. Advertencia: Este 
truco no se generaliza de manera razonable a matrices de 4 x 4 
o mayores. 



3 

0 

4 


0 

5 

1 

15. 

2 

3 

2 

16. 

4 

-3 

0 


0 

5 

-1 


2 

4 

1 


2 

—4 

3 


1 

3 

5 

17. 

3 

1 

2 

18. 

2 

1 

1 


1 

4 

-1 


3 

4 

2 


En los ejercicios 19 a 24, explore el efecto de una operación elemen¬ 
tal de fila sobre el determinante de una matriz. En cada caso, esta¬ 
blezca la operación de fila y describa cómo afecta al determinante. 


19. 


a b 


c d 

20. 

a b 


a b 

c d 

’ 

a b 

c d 

’ 

kc kd 


22 . 


23. 


24. 


a + kc 
c 

1 ' 

-4 
2 


b + kd 
d 


k 

-3 

2 


b c 
2 2 
5 6 


3 2 2 
abe 
6 5 6 


En los ejercicios 25 a 30, calcule los determinantes de las matrices 
elementales dadas. (Véase la sección 2.2). 



' 1 

0 

0“ 


' 1 

0 

0' 

25. 

0 

1 

0 

26. 

0 

1 

0 


0 

k 

1 _ 


k 

0 

1 


k 

0 

0" 


' 1 

0 

0' 

27. 

0 

1 

0 

28. 

0 

k 

0 


0 

0 

1_ 


0 

0 

1 


'0 

1 

0' 


'0 

0 

1' 

29. 

1 

0 

0 

30. 

0 

1 

0 


o 

0 

1 


1 

0 

0 


Con base en los ejercicios 25 a 28, conteste las preguntas de los ejer¬ 
cicios 31 y 32. Exprese las razones de sus respuestas. 

31. ¿Cuál es el determinante de una matriz con remplazo elemental 
de fila? 

32. ¿Cuál es el determinante de una matriz de escalamiento elemen¬ 
tal con k en la diagonal? 

En los ejercicios 33 a 36, compruebe que det EA = (det £j(det A). 
donde E es la matriz elemental mostrada y A ' 


33. 


"0 

r 

34. 

' 1 

0' 

1 

0 

0 

k 

" 1 

k 

36. 

' 1 

0" 

0 

1 

k 

1 


35. 


37. Sea A = 


38. Sean A = 


. Escriba 5A. ¿det 5A = 5 det A? 


y k un escalar. Encuentre una fórmula que 


relacione al det M con k y det A. 

En los ejercicios 39 y 40, A es una matriz de n x n. Marque cada 
enunciado como verdadero o falso. Justifique sus respuestas. 

39. a) Un determinante de n x n está definido por determinantes de 

submatrices de (n — 1) x (n — 1). 

b) El cofactor (i, j ) de una matriz A es la matriz A¡j obtenida al 
eliminar de A la i-ésima fila y lay-ésima columna. 

40. a) El desarrollo por cofactores de det A a lo largo de una co¬ 

lumna es el negativo del desarrollo por cofactores a lo largo 
de una fila. 
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tí) El determinante de una matriz triangular es la suma de las 
entradas sobre la diagonal principal. 


ción 2.1). Repita los cálculos para otros tres pares de matrices 
de n x n, con diversos valores de n. Informe sus resultados. 


41. 


Sean u = 



. Calcule el área del paralelogramo 


determinado por u, v, u + v y 0. y obtenga el determinante de 
[u v], ¿Hay comparación entre ambos resultados? Remplace 
la primera entrada de v por un número arbitrario x, y repita 
el problema. Realice un esquema y explique lo que haya 
encontrado. 


42. 


Sean u = 



c 

0 


, donde a , b, c son positivos (para 


simplificar). Calcule el área del paralelogramo definido por u, 
v, u + v y 0, y obtenga los determinantes de las matrices [u v] 
y [v u]. Realice un esquema y explique sus resultados. 


43. [M] ¿Es verdad que det(A + B) = det A + det B1 Para ave¬ 
riguarlo, genere matrices aleatorias A y £ de 5 x 5, y calcule 
det (A + B) — det A — det B. (Consulte el ejercicio 37 de la sec- 


44. [M] ¿Es cierto que det AB = (det A)(det 5)? Experimente con 
cuatro pares de matrices aleatorias, como en el ejercicio 43, y 
haga una conjetura. 

45. [M] Construya una matriz aleatoria A de 4 x 4, con entradas en¬ 
teras entre —9 y 9, y compare det A con det A T , det(—A), det(2A) 
y det(lOA). Repita el ejercicio con otras dos matrices aleatorias 
de 4 x 4, y haga conjeturas acerca de cómo se relacionan esos 
determinantes. (Véase el ejercicio 36 de la sección 2.1). Luego, 
compruebe sus conjeturas con varias matrices enteras aleatorias 
de 5 x 5 y de 6 x 6 . Si es necesario, modifique sus conjeturas e 
informe sus resultados. 

46. [M] ¿Cómo se relaciona det A 1 con det A? Experimente con 
matrices enteras aleatorias de n x n, para n = 4, 5 y 6, y haga 
una conjetura. Nota: En el improbable caso de que se encuentre 
con una matriz con determinante cero, redúzcala a una forma 
escalonada y analice su resultado. 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Aproveche los ceros. Inicie con un desarrollo por cofactores a lo largo de la tercera columna 
para obtener una matriz de 3 x 3, que se puede evaluar con un desarrollo a lo largo de su 
primera columna. 


5 

-7 

2 

2 


0 

-5 

3 

-8 

0 

0 

-4 

3 

= (—1) 1+3 2 

0 

5 

0 

-6 



= 2 • (— 1 ) 2 + 1 (— 5 ) 


20 


El (—1) 2+1 en el penúltimo cálculo viene de la posición (2, 1) del —5 en el determinante 
de 3 x 3. 


3.2 


PROPIEDADES DE LOS DETERMINANTES 


El secreto de los determinantes reside en cómo cambian cuando se efectúan operaciones de 
fila. El siguiente teorema generaliza los resultados de los ejercicios 19 a 24 de la sección 3.1. 
La demostración se encuentra al final de esta sección. 


TEOREMA 3 Operaciones de fila 

Sea A una matriz cuadrada. 

a) Si un múltiplo de una fila de A se suma a otra fila para producir una matriz B , enton¬ 
ces det B = det A. 

b ) Si dos filas de A se intercambian para producir B , entonces det B = —det A. 

c) Si una fila de A se multiplica por k para producir B, entonces det B = k ■ det A. 


Los siguientes ejemplos muestran cómo utilizar el teorema 3 para calcular determinantes 
con eficiencia. 
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Determinantes 


EJEMPLO 1 


Calcule det A, donde A = 



-4 

8 

7 


2 

-9 

0 


SOLUCIÓN La estrategia es reducir A a una forma escalonada y luego utilizar el hecho de 
que el determinante de una matriz triangular es el producto de las entradas diagonales. Los 
primeros dos remplazos de fila en la columna 1 no alteran al determinante: 



1 

-4 

2 


1 

-4 

2 


1 

-4 

2 

det A = 

-2 

8 

-9 

= 

0 

0 

-5 

= 

0 

0 

-5 


-1 

7 

0 


-1 

7 

0 


0 

3 

2 


Un intercambio de las filas 2 y 3 invierte el signo del determinante, de manera que 


det .4 = 


1 -4 2 

0 3 2 

0 0-5 


— (1 )(3)(—5) =15 ■ 


Un uso común del teorema 3c) en cálculos a mano es factorizar un múltiplo común de 
una fila de una matriz. Por ejemplo, 


* * 
5 k —2 k 


* * 



* 

3 

* 


donde las entradas con asterisco quedan inalteradas. Este paso se emplea en el siguiente 
ejemplo. 


EJEMPLO 2 


Calcule det A, donde A = 



6 8 

5 10 

1 -2 
0 6 


SOLUCIÓN Para simplificar la aritmética, se desea un 1 en la esquina superior izquierda. Se 
podrían intercambiar las filas 1 y 4. Pero, en vez de ello, se saca el factor 2 de la fila superior, 
y luego se procede con remplazos de fila en la primera columna: 


1 

-4 

3 

4 


1 

-4 

3 

4 

3 

-9 

5 

10 

= 2 

0 

3 

-4 

-2 

-3 

0 

1 

-2 


0 

-12 

10 

10 

1 

-4 

0 

6 


0 

0 

-3 

2 


Después, se podría sacar otro factor 2 de la fila 3 o utilizar como pivote el 3 en la segunda co¬ 
lumna. Seleccionamos la última operación, sumando a la fila 3 la fila 2 multiplicada por 4: 


det A = 2 


1 

0 

0 

0 


-4 3 4 

3 -4 -2 
0-6 2 
0-3 2 


Por último, sumando la fila 3 multiplicada por —1/2 a la fila 4, y calculando el determinante 
“triangular'’, se encuentra que 


1-434 
0 3-4-2 

0 0-62 
0 0 0 1 


det A = 2 


= 2- (1)(3)( 6) (1) = —36 
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U = 


a * * 

0 ■ * 

0 0 » 

0 0 0 

det V * 0 


* 

* 


u = 


o ■ * * 

0 0 0 » 

0 0 0 0 

det U = 0 


FIGURA 1 

Formas escalonadas típicas de 
matrices cuadradas. 


Suponga que una matriz cuadrada A se redujo a una forma escalonada U mediante rem¬ 
plazos de fila e intercambios de fila. (Esto siempre es posible. Véase el algoritmo de reduc¬ 
ción por filas en la sección 1.2). Si hay r intercambios, entonces el teorema 3 indica que: 

det A = (— 1)' det U 

Como U está en forma escalonada, es triangular, y así det U es el producto de las entra¬ 
das diagonales Mu,..., u, m . Si A es invertible, las entradas u¡¡ son todas pivotes (porque A ~ /„ 
y las un no se han escalado a 1). De otra forma, al menos u nn es cero, y el producto Un ''' u„ n 
es cero. Véase la figura 1. Por lo tanto. 



( 1 )' • í P roducto de j 

cuando A es invertible 

det A = < 

1 pivotes en U J 



[ 0 

cuando A no es invertible 


Es interesante hacer notar que aunque la forma escalonada U que se acaba de describir no 
es única (porque no está completamente reducida por filas), y los pivotes no son únicos, el 
producto de los pivotes es único, excepto por un posible signo menos. 

La fórmula (1) no solo da una interpretación concreta de det A, sino que también demues¬ 
tra el principal teorema de esta sección: 


E 0 R E ÍVl A Una matriz cuadrada A es invertible si y solo si det A V 0. 


El teorema 4 agrega el enunciado “det A V 0” al teorema de la matriz invertible. Un útil 
corolario es que det A = 0 cuando las columnas de A son linealmente dependientes. Además, 
det A = 0 cuando las filas de A son linealmente dependientes. (Filas de A son columnas de 
A t , y columnas linealmente dependientes de A 1 hacen que A 1 sea singular. Cuando A 1 es sin¬ 
gular, también lo es A, de acuerdo con el teorema de la matriz invertible). En la práctica, la 
dependencia lineal es evidente cuando dos columnas o dos filas son iguales, o una columna 
o fila es cero. 


EJEMPLO 

SOLUCIÓN 


3 Calcule det A, donde A = 


Sume la fila 1 multiplicada por 


det A = det 


3 

0 

0 

-5 


3-1 2 

0 5-3 

-6 7 -7 

-5 -8 0 

2 a la fila 3 para 

-1 2 —5 " 

5 -3 -6 
5 -3 -6 
-8 0 9 


-5 
-6 
4 • 

9 

obtener 


= 0 


ya que la segunda y tercera filas de la segunda matriz son iguales. 


WEB 


- NOTA NUMÉRICA - 

1. La mayoría de los programas de cómputo que calculan det A para una matriz gene¬ 
ral A utilizan el método de la fórmula (1) anterior. 

2. Es posible demostrar que la evaluación de un determinante de n x n, utilizando 
operaciones de fila, requiere cerca de 2 h 3 /3 operaciones aritméticas. Cualquier mi- 
crocomputadora moderna es capaz de calcular un determinante de 25 x 25 en una 
fracción de segundo, porque solo necesita realizar unas 10,000 operaciones. 
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CAPITULO 3 


Determinantes 


Las computadoras también pueden manejar grandes matrices “dispersas”, con rutinas 
especiales que aprovechan la presencia de muchos ceros. Desde luego, las entradas cero tam¬ 
bién aceleran los cálculos a mano. Los cálculos en el siguiente ejemplo combinan el poder de 
las operaciones de fila con la estrategia de la sección 3.1, consistente en utilizar entradas nulas 
en los desarrollos por cofactores. 


EJEMPLO 4 


Calcule det A , donde A = 


0 12-1 
2 5-73 

0 3 6 2 

-2 -5 4 -2 


SOLUCIÓN Una buena forma de comenzar es utilizar como pivote el 2 en la columna 1, 
eliminando el —2 que está debajo de este. Después se utiliza un desarrollo por cofactores 
para reducir el tamaño del determinante, y luego otra operación de remplazo de fila. De esta 
forma, 


det A = 


0 

2 

0 

0 


1 

5 

3 

0 



1 

2 

-1 


1 

2 

-1 

= -2 

3 

6 

2 

= -2 

0 

0 

5 


0 

-3 

1 


0 

-3 

1 


Un intercambio de las filas 2 y 3 producirían un “determinante triangular”. Otro enfoque con¬ 
siste en efectuar un desarrollo en cofactores a lo largo de la primera columna: 


det A = (—2)(1) 


0 

-3 


-2-(15) 


-30 


Operaciones de columna 

Es posible realizar operaciones sobre las columnas de una matriz en forma análoga a las 
operaciones de fila que hemos estudiado. El siguiente teorema indica que las operaciones de 
columna y las operaciones de fila tienen los mismos efectos sobre los determinantes. 


TEOREMA 5 


Si A es una matriz de n x n , entonces det A r = det A. 


DEMOSTRACIÓN El teorema es evidente para n = 1. Suponga que el teorema es verdadero 
para determinantes de k x k, y sea n = k + 1. Entonces el cofactor de ay en A es igual al co- 
factor de a¡\ en A 1 , porque los cofactores implican determinantes de k x k. Así que el desarro¬ 
llo por cofactores de det A a lo largo de la primera fila es igual al desarrollo por cofactores de 
det A r a lo largo de la primera columna. Es decir, A y A T tienen determinantes iguales. Por lo 
tanto, el teorema es válido para n = 1, y la veracidad del teorema para un valor de n implica su 
veracidad para el siguiente valor de n. Por el principio de inducción, el teorema es verdadero 
para toda n > 1. ■ 

De acuerdo con el teorema 5, cada enunciado en el teorema 3 es válido cuando en todas 
partes la palabra fila se remplaza por columna. Para comprobar esta propiedad, basta aplicar 
a A t el teorema 3 original. Una operación de fila sobre A 1 significa una operación de columna 
sobre A. 

Las operaciones de columna son útiles tanto para fines teóricos como para realizar cálcu¬ 
los a mano. Sin embargo, para simplificar solo se efectuarán operaciones de fila en cálculos 
numéricos. 

Determinantes y productos matriciales 

La demostración del siguiente útil teorema se encuentra al final de la sección. Las aplicacio¬ 
nes se exponen en los ejercicios. 
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TEOREMA 6 Propiedad multiplicativa 

Si A y B son matrices de n x n, entonces det AB = (det A)(det B). 


EJEMPLO 5 Compruebe el teorema 6 para A 


6 

3 



3 

2 


SOLUCIÓN 


'6 

r 

'4 3' 


'25 

20' 

3 

2 

1 2 


14 

!3 _ 


y 


det AB = 25 • 13 — 20 • 14 = 325 — 280 = 45 


Como det A = 9 y det B = 5, 

(det A) (det B) = 9 ■ 5 = 45 = det AB a 

Advertencia: Un error común es pensar que el teorema 6 tiene un análogo para sumas de 
matrices. Sin embargo, en general, det(A + B) no es igual a det A + det B. 


Propiedad de linealidad de la función determinante 

Para una matriz A de n x n, podemos considerar a det A como una función de los n vectores 
columna en A. Se demostrará que si todas las columnas se mantienen fijas, excepto una, en¬ 
tonces det A es una función lineal de una variable (vectorial). 

Suponga que a la /-ésima columna de A se le permite variar, lo que se escribe como 

A=[ a i ••• &j-\ x a J+1 ••• a„ ] 

Defina una transformación T de IR" a R mediante 

r(x) = det[a, ••• a y—i x a ; - + i ••• a„ ] 


Así, 


T(cx) = cT(x) para todos los escalares c, y todas las x en R' ! . (2) 

7(u 4- v) = 71 u) + 71 v) para toda u, v en R". (3) 

La propiedad (2) es el teorema 3c) aplicado a las columnas de A. Una demostración de la 
propiedad (3) es consecuencia de un desarrollo por cofactores a lo largo de la /-ésima columna 
de det A. (Véase el ejercicio 43). Esta propiedad de (multi)linealidad del determinante tiene 
muchas consecuencias útiles que se estudian en cursos más avanzados. 


Demostraciones de los teoremas 3 y 6 

Es conveniente someter a prueba el teorema 3 cuando se enuncia en términos de las matrices 
elementales analizadas en la sección 2.2. Una matriz elemental E se denomina matriz de rem¬ 
plazo de fila si E se obtiene a partir de la identidad 7 al sumar un múltiplo de una fila a otra; E 
es un intercambio si E se obtiene mediante el intercambio de dos filas de 7; y 7? es una escala 
por r si E se obtiene al multiplicar una fila de I por un escalar r diferente de cero. Con esta 
terminología, el teorema 3 se puede reformular de la siguiente manera: 
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Si A es una matriz de n x n y E es una matriz elemental de n x n, entonces 

det EA = (det £)(det A) 

donde 

1 si E es un remplazo de fila 
det E = — 1 si E es un intercambio 

r si E es una escala por r 

DEMOSTRACIÓN DEL TEOREMA 3 La demostración es por inducción sobre el tamaño 
de A. El caso de una matriz de 2 x 2 se comprobó en los ejercicios 33 a 36 de la sección 3.1. 
Suponga que el teorema se ha comprobado para determinantes de matrices de k x k, con k > 2; 
sea n = k + 1 y sea A de n x n. La acción de E sobre A implica a dos filas o solamente a una. 
Así, se puede desarrollar det EA a lo largo de una fila que es inalterada por la acción de E, 
por ejemplo, la fila i. Sea Ay (respectivamente, By) la matriz obtenida al eliminar la fila i y la 
columna j de A (respectivamente, EA). Luego, las filas de By se obtienen de las filas de Ay por 
el mismo tipo de operación elemental de fila que E efectúa sobre A. Como esas submatrices 
son únicamente de k x k, la suposición de inducción implica que 

det By = a • det Ay 

donde a = 1, — 1, o r, dependiendo de la naturaleza de E. El desarrollo por cofactores a lo 
largo de la fila i es 

detZCA = a¡i(— 1) !+1 det B¡\ + • • • + a in {— 1)' + " det B in 

= aa¡i{—\) l+l det A,i + • • • + cta in (— 1)' + " det A¡„ 

= a ■ det A 

En particular, tomando A = /„, se observa que det E = 1, — 1, o r, dependiendo de la natura¬ 
leza de E. Así, el teorema es válido para n = 2, y la veracidad del teorema para un valor de 
n implica su veracidad para el siguiente valor de n. Por el principio de inducción, el teorema 
debe ser válido para n > 2. El teorema es trivialmente verdadero para n = 1. ■ 

DEMOSTRACIÓN DEL TEOREMA 6 SiA no es invertible, entonces AB tampoco lo es, de 
acuerdo con el ejercicio 27 de la sección 2.3. En este caso, det AB = (det A)(det B), porque 
ambos lados valen cero, por el teorema 4. Si A es invertible, entonces A y la matriz identidad 
/„ son equivalentes por filas de acuerdo con el teorema de matriz invertible. Así, existen ma¬ 
trices elementales E\,..., E p tales que 

A = EpEp-i-'-Ex ■ I n = EpE p -i---Ei 

Por brevedad, escribimos |a| en vez de det A. De esta forma, la repetida aplicación del teore¬ 
ma 3, como se acaba de reformular, muestra que 

\AB\ = \E p ■ ■ ■ E\B\ = \EpWEp-i-EiBl = 

= \E p \-\E l \\B\=- = \E p -E 1 \\B\ 

= \A\\B\ u 

PROBLEMAS DE PRÁCTICA 

2 

~ en el menor número de pasos que sea posible. 

8 


1. Calcule 


1—3 1 — 

2 -5 -1 - 

0-4 5 

-3 10 -6 
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2. Utilice un determinante para decidir si vi, v 2 , v 3 son linealmente independientes, cuando 


Vi = 

5 

-7 

, v 2 = 

"-3 

3 

, v 3 = 

2" 

-7 


9 


-5 


5 


3.2 EJERCICIOS 


En los ejercicios 1 a 4 cada ecuación ilustra una propiedad de los 
determinantes. Enuncie la propiedad. 



0 

5 

-2 



1 

-3 

1 

5 

1. 

1 

-3 

6 

= - 

- 

0 

5 


2 


4 

-1 

8 



4 

-1 


8 


2 

-6 

4 



1 

-3 

2 


2. 

3 

5 

-2 

= ' 

2 

3 

5 

-2 



1 

6 

3 



1 

6 

3 



1 

3 

—4 


1 

3 

-4 


3. 

2 

0 

-3 

= 

0 

-6 

5 



5 

-4 

7 



5 

-4 

7 



1 

2 

3 


1 

2 

3 


4. 

0 

5 

—4 

= 

0 

5 

-4 



3 

7 

4 


0 

1 

-5 



En los ejercicios 5 a 10 encuentre los determinantes por reducción de 
filas a una forma escalonada. 


1 

5 

—6 



1 

5 

-3 



-1 

—4 

4 



6. 

3 

-3 

3 



-2 

-7 

9 



2 

13 

-7 



1 

3 

0 

2 


1 

3 


3 

—4 

-2 

-5 

7 

4 


8. 

0 

1 


2 

-5 

3 

5 

2 

1 


2 

5 


\ 

-3 

1 

-1 

2 

-3 


-3 

-7 


5 

2 

1 

-1 

-3 

0 







0 

1 

5 

4 







-1 

2 

8 

5 







3 

-1 

-2 

3 







1 

3 

-1 

0 

—2 






0 

2 

-4 

-1 

-6 






-2 

-6 

2 

3 

9 






3 

7 

-3 

8 

-1 






3 

5 

5 

2 

7 







En los ejercicios 11 a 14 calcule los determinantes combinando los 
métodos de reducción por filas y desarrollo por cofactores. 


2 

5 

-3 

-1 


-1 

2 

3 

0 

3 

0 

1 

-3 

12. 

3 

4 

3 

0 

-6 

0 

-4 

9 

5 

4 

6 

6 

4 

10 

-4 

-1 


4 

2 

4 

3 

2 

5 

4 

1 


-3 

—2 

1 

—4 

4 

7 

6 

2 

14. 

1 

3 

0 

-3 

6 

—2 

—4 

0 

-3 

4 

—2 

8 

—6 

7 

7 

0 


3 

-4 

0 

4 


En los ejercicios del 15 al 20, calcule los determinantes, donde 
= 7. 


15. 


17. 


19. 


20 . 



c 

e 

h 

f 

i 

a 

b 

d 

e 

5g 

5h 

a 

b 

g 

d 

h 

e 

a 


2 d + 

a 

g 


ci -\- d 


d 

g 


f 

b 

2 e + b 

h 

b + e 
e 
h 


16. 


18. 


c 

2 f+c 


c + f 
f 

i 


a 

2 ,d 


b 

3e 

h 


c 

3/ 

i 


En los ejercicios 21a 23, use determinantes para saber si la matriz 
es invertible. 



'2 

3 

0“ 



'5 

0 

-1 ' 

21 . 

1 

3 

4 


22. 

1 

—3 

—2 


1 

2 

1 



0 

5 

3 


'2 

0 

0 

8" 





23. 

1 

-7 

-5 

0 





3 

8 

6 

0 






0 

7 

5 

4 






En los ejercicios 24 a 26, utilice determinantes para saber si el con¬ 
junto de vectores es linealmente independiente. 




En los ejercicios 27 y 28, Ay B son matrices de n x n. Marque cada 
enunciado como verdadero o falso. Justifique sus respuestas. 

27. a) Una operación de remplazo por filas no afecta al determi¬ 
nante de una matriz. 

tí) El determinante de A es el producto de los pivotes en cual¬ 
quier forma escalonada U de A, multiplicada por (— 1)', don¬ 
de r es el número de intercambios de fila realizados durante 
la reducción por filas de A a U. 
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c ) Si las columnas de A son linealmente dependientes, entonces 
det A = 0. 

d) det(A + B) = det A + det B. 


28. a) Si dos intercambios de fila se realizan en secuencia, enton¬ 
ces el nuevo determinante es igual al determinante original. 

b) El determinante de A es el producto de las entradas diagona¬ 
les en A. 


c ) Si det A es cero, entonces dos filas o dos columnas son igua¬ 
les, o una fila o una columna es cero. 

d) det A T = ( — l)det A. 


29. Calcule det B 5 , donde B 


1 0 1 
1 1 2 
1 2 1 


30. Utilice el teorema 3 (pero no el teorema 4) para demostrar 
que si dos filas de una matriz cuadrada A son iguales, entonces 
det A = 0. Lo mismo es válido para dos columnas. ¿Por qué? 


En los ejercicios 31a 36, su explicación debe mencionar un teorema 
pertinente. 

31. Demuestre que si A es invertible, entonces det A -1 = -. 

det A 


32. Obtenga una fórmula para det(rA) cuando A es una matriz de 
n x n. 


33. Sean A y B matrices cuadradas. Demuestre que aun cuando 
AB y BA pueden no ser iguales, siempre es verdad que 
det AS = detfiA. 


34. Sean Ay P matrices cuadradas, con P invertible. Demuestre que 
d et(PAP~ v ) = det A. 

35. Sea U una matriz cuadrada tal que U T U = 1. Demuestre que 
det U = ± 1. 


36. Suponga que A es una matriz cuadrada tal que det A 4 = 0. 
Explique por qué A no puede ser invertible. 


En los ejercicios 37 y 38, compruebe que det AB = (det A)(det B) 
para las matrices dadas. (No utilice el teorema 6). 


37. 




0 

4 


38. A = 



4 

-1 


2 

-1 


39. Sean A y B matrices de 3 x 3, con det A = 4 y det B = —3. 
Con base en propiedades de determinantes (en el libro y en los 


ejercicios anteriores), calcule: 

a) det AB b) det 5A c) det B T 

d) detA -1 é) det A 3 


40. Sean Ay B matrices de 4x4, con det A = — 1 y det B = 2. 
Calcule: 


a) det AB tí) det B 5 c ) det 2A 

d) detA r A e) det B l AB 


41. Compruebe que det A = det B + det C, donde 


A = 


a + e 
c 


b + f 
d 




f 

d 


42. 


Sean 



0 

1 


B = 


b 

d 


Demuestre que 


det(A + B) = det A + det B si y solo si a + d = 0. 


43. Compruebe que det A = det B + det C, donde 



a a 

a 12 

U\ + Vi 




A = 

«21 

«22 

u 2 + V 2 

, 




_ «31 

«32 

^3 





«11 

a 12 

U\ 


a n 

«12 

Vi 

B = 

«21 

«22 

U2 

, c 


fl21 

«22 

Vi 


_ «31 

«32 

l¿3 

1 

_ fl 31 

O 32 

v 3 _ 


Sin embargo, observe, que A no es igual a B + C. 

44. La multiplicación por la derecha por una matriz elemental E 
afecta a las columnas de A en la misma forma que la multipli¬ 
cación por la izquierda afecta a las filas. Utilice los teoremas 
3 y 5, así como el evidente resultado de que E T es otra matriz 
elemental, para demostrar que 
det AE = (det £)(det A) 

No utilice el teorema 6. 


45. [M] Calcule det A T A y det AA T para varias matrices de 4 x 5 
aleatorias y diversas matrices de 5 x 6 , también aleatorias. ¿Qué 
puede decirse acerca de A T A y AA T cuando A tiene más colum¬ 
nas que filas? 

46. [M] Si det A es cercano a cero, ¿la matriz A es casi singular? 
Experimente con la matriz A de 4 x 4 casi singular del ejercicio 
9 de la sección 2.3. Calcule los determinantes de A, 10A y 0.1A. 
Por otra parte, calcule los números de condición de esas ma¬ 
trices. Repita los cálculos cuando A es la matriz identidad de 
4x4. Analice sus resultados. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Realice remplazos de fila para crear ceros en la primera columna y así obtener una fila 
de ceros. 


1 

-3 

1 

-2 


1 

-3 

1 

-2 


1 

-3 

1 

-2 

2 

-5 

-1 

-2 


0 

1 

-3 

2 


0 

1 

-3 

2 

0 

-4 

5 

1 


0 

-4 

5 

1 


0 

-4 

5 

1 

-3 

10 

-6 

8 


0 

1 

-3 

2 


0 

0 

0 

0 
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5-3 2 


5-3 2 

2 . det [ vi V 2 V 3 ] = 

-7 3 -7 

9-5 5 

— 

-2 0 -5 

9-5 5 



= 3 • (35) + 5 • (-21) = 0 


Fila 1 sumada 
a la fila 2 


Cofactores de 
la columna 2 


Según el teorema 4, la matriz [vi \2 V 3 ] no es invertible. Las columnas son linealmente 

dependientes, de acuerdo con el teorema de la matriz invertible. 


3.3 REGLA DE CRAMER, VOLUMEN Y TRANSFORMACIONES LINEALES 


Esta sección aplica la teoría de las secciones anteriores para obtener importantes fórmulas 
teóricas y una interpretación geométrica del determinante. 

Regla de Cramer 

La regla de Cramer es necesaria en una variedad de cálculos teóricos. Por ejemplo, se puede 
utilizar para estudiar cómo resulta afectada la solución de Ax = b por cambios en las entradas 
de b. Sin embargo, la fórmula es ineficiente para cálculos a mano, excepto para matrices de 
2 x 2, o quizá de 3 x 3. 

Para cualquier matriz A de n x n y cualquier b en IR", sea A,(b) la matriz obtenida a partir 
de A al remplazar la columna i por el vector b. 


A,(b) = [ai ••• b ••• a„] 

1 

col i 


TEOREMA 7 


Regla de Cramer 

Sea A una matriz invertible de n x n. Para cualquier b en R", la única solución x de 
Ax = b tiene entradas dadas por 


det A¡ (b) 
det A 


i = 1, 2,..., n 


( 1 ) 


DEMOSTRACIÓN Denote las columnas de A por ai,..., a„ y las columnas de la matriz iden¬ 
tidad I de n x n por ei,..., e„. Si Ax = b, la definición de multiplicación matricial indica que 

A • I¡ (x) = A [ d • • • x • • • e„ ] = [ Aei • • • Ax • • • Ae„ ] 

= [ai ••• b ••• a„ ] = A,(b) 

Por la propiedad multiplicativa de determinantes, 

(det A)(det 7,(x)) = detA,(b) 

El segundo determinante a la izquierda es simplemente x¡. (Realice un desarrollo por cofac¬ 
tores a lo largo de la /-ésima fila). Así, (det A) • x¡ = det A,(b). Esto demuestra (1), ya que A 
es invertible y det A A 0. ■ 

EJEMPLO 1 Use la regla de Cramer para resolver el sistema 

3xi — 2 x 2 = 6 
—5xi + 4x2 = 8 
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SOLUCIÓN Vea el sistema como Ax = b. Utilizando la notación ya presentada, 


A = 




AAb) = 



A 2 (b) = 


6 

8 


Como det A = 2, el sistema tiene una solución única. Por la regla de Cramer, 


Xi 


x 2 


det Ai (b) 
det A 
det A 2 (b) 
det A 


24 + 16 
2 

24+30 

2 


20 

27 


Aplicación a la ingeniería 

Un gran número de importantes problemas de ingeniería, particularmente en teoría del con¬ 
trol e ingeniería eléctrica, se pueden analizar con las transformadas de Laplace. Este enfoque 
convierte un adecuado sistema de ecuaciones diferenciales lineales a un sistema de ecua¬ 
ciones algebraicas lineales cuyos coeficientes implican un parámetro. El siguiente ejemplo 
ilustra el tipo de sistema algebraico que puede presentarse. 


EJEMPLO 2 Considere el siguiente sistema, en el cual s es un parámetro no especificado. 
Determine los valores de s para los cuales el sistema tiene una solución única, y utilice la regla 
de Cramer para describir la solución. 

3sxi — 2x 2 = 4 
— 6x¡ + SX 2 = 1 


SOLUCIÓN Vea el sistema como Ax = b. De esta forma, 


A = 


3s 

-6 



A i(b) 



A 2 (b) 


35 4 

-6 1 


Puesto que 


det A = 3s 2 - 12 = 30 + 2)0 - 2) 


el sistema tiene una solución única precisamente cuando s ¥= ±2. Para tal s, la solución es 
0+ x 2 ), donde 


Xi 


det Ai(b) 
det A 


det A 2 (b) 

x 2 = -- 

det A 


4.5 + 2 

30 + 2)0 - 2 ) 
3í + 24 
30 + 2)0 - 2 ) 


5 + 8 

(5 + 2)0 - 2) 


Una fórmula para A 1 

La regla de Cramer conduce fácilmente a una fórmula general para la inversa de una matriz A 
de n x n. La /-ésima columna de A -1 es un vector x que satisface 


Ax = e ; 

donde e ; - es la j-ésima columna de la matriz identidad, y la í-ésima entrada de x es la entrada 
(i,j) de A A De acuerdo con la regla de Cramer, 


¡ entrada (i, f) de A 1 } = x¡ 


det A ¡ (e j ) 


det A 


( 2 ) 
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Recuerde que Aj¡ denota la submatriz de A formada al eliminar la fila j y la columna i. Un 
desarrollo por cofactores a lo largo de la columna i de ,4,(e ; ) muestra que 

det Ai (e ; ) = (- l) i+ J det Aj¡ = C# (3) 


donde Cj¡ es un cofactor de A. De acuerdo con la expresión (2), la entrada (i,j) de A -1 es el 
cofactor Cj¡ dividido entre det A. [Observe que los subíndices en C¡¡ son los inversos de (/',/)]. 
Por consiguiente, 



'Cu 

C 21 •• 

C„ 1 

1_ 1 

C 12 

C 22 

c„ 2 

det A 

C u 

C2n 

c 

'-'nn 


(4) 


La matriz de cofactores en el miembro derecho de (4) se llama la adjunta de A, que se 
denota con adj A. (El término adjunta también tiene otro significado en libros avanzados de 
transformaciones lineales). El siguiente teorema reformula la expresión (4). 


TEOREMA 8 


Una fórmula para la inversa 

Sea A una matriz invertible de n x n. Así, 


A' 1 = 


1 

det A 


adj A 


EJ EM PLO 3 Encuentre la inversa de la matriz A 


2 1 3 

1 -1 1 
1 4 -2 


-1 1 
4 -2 

3 

-2 


SOLUCIÓN Los nueve cofactores son 
Cu = + 

C 21 = — 

C 31 = + 


1 3 

-1 1 


= — 2 , C\2 = — 

14, C 22 = + 

= 4, C 32 = - 


1 1 
1 -2 

2 3 

1 -2 

2 3 

1 1 


3, 


1, 


C 13 = + 
C23 = — 
C 33 = + 


1 -1 

1 4 

2 1 

1 4 

2 1 
1 -1 


-7 

-3 


La matriz adjunta es la transpuesta de la matriz de cofactores. [Por ejemplo, C 12 va a la po¬ 
sición (2, 1).] Así, 


adj A 


14 4 

-7 1 

-7 -3 


Se podría calcular det A directamente, pero el siguiente cálculo ofrece una comprobación de 
las operaciones anteriores y produce det A: 



'-2 

14 

4" 

2 

1 

3" 


' 14 

0 

0 

(adj A) • A = 

3 

-7 

1 

1 

-1 

1 

= 

0 

14 

0 


5 

-7 

-3 

1 

4 

-2 


0 

0 

14 


Puesto que (adj A)A = 147, el teorema 8 indica que det A = 14 y 


"-2 

14 

4" 


'-1/7 

1 

2/7 " 

3 

-7 

1 

= 

3/14 

- 1/2 

1/14 

5 

-7 —3 J 


5/14 

- 1/2 

-3/14 
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- NOTA NUMÉRICA - 

El teorema 8 es útil principalmente para cálculos teóricos. La fórmula para A -1 permite 
deducir propiedades de la inversa sin calcularla en realidad. Excepto para casos espe¬ 
ciales, el algoritmo de la sección 2.2 ofrece una forma mucho mejor de calcular A -1 , si 
la inversa es realmente necesaria. 

La regla de Cramer también es una herramienta teórica. Se puede emplear para 
estudiar qué tan sensible es la solución de Ax = b ante cambios en una entrada de b o 
de A (quizá debido al error experimental cuando se obtienen las entradas para b o A). 
Cuando A es una matriz de 3 x 3 con entradas complejas, entonces algunas veces la 
regla de Cramer se utiliza en cálculos a mano porque la reducción por filas de [A b | 
con aritmética compleja puede resultar confusa, y los determinantes son bastante fáci¬ 
les de calcular. Para grandes matrices de n x n (reales o complejas), la regla de Cramer 
es irremediablemente ineficiente. Para calcular solo un determinante se requiere tanto 
trabajo como resolver Ax = b por reducción de filas. 


Determinantes como área o volumen 

En la siguiente aplicación, se comprueba la interpretación geométrica de determinantes des¬ 
crita en la introducción de este capítulo. Aunque en el capítulo 6 se hará un análisis general de 
longitud y distancia en IR", aquí se supone que los conceptos euclidianos usuales de longitud, 
área y volumen ya se entienden para IR 2 y IR 3 . 


TEOREMA 9 Si A es una matriz de 2 x 2, el área del paralelogramo definido por las columnas de A 
es |det A|. Si A es una matriz de 3 x 3, el volumen del paralelepípedo definido por las 
columnas de A es Idet Al. 


y 



X 


FIGURA 1 

Área = \ad\. 


DEMOSTRACIÓN Como es evidente, el teorema es cierto para cualquier matriz diagonal 
de 2 x 2 : 


det 


\ad\ 


{ área del 
rectángulo 


Véase la figura 1. Será suficiente demostrar que cualquier matriz de 2 x 2, A = [ai 82 ], 
se puede transformar a una matriz diagonal de tal manera que no cambie el área del para¬ 
lelogramo asociado ni tampoco |det A|. De la sección 3.2, se conoce que el valor absoluto 
del determinante es inalterado cuando dos columnas se intercambian, o un múltiplo de una 
columna se suma a otra. Es fácil ver que tales operaciones son suficientes para transformar 
a A en una matriz diagonal. Los intercambios de columnas no modifican el paralelogramo. 
Así, es suficiente probar la siguiente sencilla observación geométrica que se aplica a vectores 
en IR 2 o IR 3 : 


Sean ai y a 2 vectores diferentes de cero (no nulos). Luego, para cualquier escalar c, el 
área del paralelogramo definido por U| y a 2 es igual al área del paralelogramo determi¬ 
nado por ai y a 2 + caí. 


Para demostrar este enunciado, se supone que a 2 no es un múltiplo de ai, ya que, de 
otra forma, los dos paralelogramos serían degenerados y tendrían área igual a cero. Si L 
es la recta que pasa por 0 y ai, entonces a 2 + L es la recta que pasa por a 2 paralela al, y 
a 2 + caí es tá sobre esta recta. Véase la figura 2. Los puntos a 2 y a 2 + caí tienen la misma 
distancia perpendicular a L. Por eso, los dos paralelogramos en la figura 2 tienen la misma 
área porque comparten la base de 0 a a¡. Esto completa la demostración para IR 2 . 



a o o 
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FIGURA 2 Dos paralelogramos de igual área. 


z 



FIGURA 3 

Volumen = \abc\. 


La demostración para IR 3 es similar. Como es evidente, el teorema es cierto para una 
matriz diagonal de 3 x 3. Véase la figura 3. Y cualquier matriz A de 3 x 3 se puede trans¬ 
formar en una matriz diagonal utilizando operaciones de columna que no cambian a |det ,4 . 
(Piense en efectuar operaciones de fila sobre A 7 ). Así, es suficiente demostrar que esas ope¬ 
raciones no afectan el volumen del paralelepípedo definido por las columnas de A. 

La figura 4 muestra un paralelepípedo como una caja sombreada con dos lados incli¬ 
nados. Su volumen es el área de la base en el plano Gen ¡ai, a^, | multiplicada por la altura 
de a 2 sobre Gen {ai, ai{. Cualquier vector a 2 + caí tiene la misma altura porque a 2 + caí 
está en el plano a 2 + Gen {ai, 83 }, el cual es paralelo a Gen {ai, 83 }. Así que el volumen 
del paralelepípedo queda inalterado cuando [ai a 2 a?] se cambia a [ai a 2 + ca¡ a?]. 
Por consiguiente, una operación de remplazo de columna no afecta el volumen del parale¬ 
lepípedo. Como el intercambio de columnas no tiene efecto sobre el volumen, la demostra¬ 
ción se completa. ■ 




FIGURA 4 Dos paralelepípedos de igual volumen. 


EJEMPLO 4 Calcule el área del paralelogramo definido por los puntos (—2, —2), (0, 3), 
(4, — 1) y ( 6 , 4). Véase la figura 5a). 

SOLUCIÓN Primero el paralelogramo se traslada de manera que un vértice esté en el ori¬ 
gen. Por ejemplo, reste el vértice (—2, —2) de cada uno de los cuatro vértices. El nuevo 
paralelogramo tiene la misma área, y sus vértices son (0, 0), (2, 5), ( 6 , 1) y ( 8 , 6 ). Véase la 
figura 5b). 




FIGURA 5 Trasladar un paralelogramo no cambia 
su área. 
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Este paralelogramo está definido por las columnas de 



Como |det A| = |—28|, entonces el área del paralelogramo es 28. ■ 


Transformaciones lineales 

Los determinantes se pueden usar para describir una importante propiedad geométrica de 
transformaciones lineales en el plano y en R 3 . Si T es una transformación lineal y S es un con¬ 
junto en el dominio de T, entonces T(S) denota el conjunto de imágenes de puntos en S. Nos 
interesa conocer cómo se compara el área (o volumen) de T(S) con el área (o volumen) del 
conjunto original S. Por conveniencia, cuando S es una región acotada por un paralelogramo, 
también nos referimos a S como un paralelogramo. 


TEOREMA 10 Sea T : R 2 —> R 2 una transformación lineal determinada por una matriz A de 2 x 2. Si S 
es un paralelogramo en R 2 , entonces 

{área de T(S)} = |det A| • {área de S} (5) 

Si T está determinada por una matriz A de 3 x 3, y si S es un paralelepípedo en R 3 , 
entonces 

{volumen de T(S)) = |det A| • {volumen de S) ( 6 ) 


DEMOSTRACIÓN Considere el caso de 2 x 2, con A = [ai 82 ]. Un paralelogramo en el 
origen en R 2 definido por los vectores y b 2 tiene la forma 

S = {íibi + .v 2 b 2 : 0 < ¿1 < 1, 0 < s 2 < 1} 


La imagen de S bajo T consiste en puntos de la forma 

T(sibi + s 2 b 2 ) = siTQbi) + s 2 T( b 2 ) 

= siAbi + s 2 Ab 2 

donde 0 < < l,0sj 2 < 1. De ello se sigue que T(S) es el paralelogramo determinado por 

las columnas de la matriz [Abi Ab 2 ]. Esta matriz se puede escribir como AB, donde B = [bi 
b 2 ]. De acuerdo con el teorema 9 y el teorema del producto para determinantes, 

{área de T(S)} = |detAZ?| = |det A| • |det5| 

= |det A| • {área de 5¡ (7) 

Un paralelogramo arbitrario tiene la forma p + S, donde p es un vector y S es un paralelogra¬ 
mo en el origen, como antes. Es fácil ver que T transforma a p + S en 7'(p) + T(S). (Véase el 
ejercicio 26). Puesto que la traslación no afecta el área de un conjunto, 

{área de 7íp + 5} = {área de r(p) + T(S) { 

= {área de T(S )} Traslación 

= |det A| • {área de 5) Por la ecuación (7) 

= |det A| • {área de p + 5} Traslación 


Esto demuestra que (5) es válida para todos los paralelogramos en R 2 . Es análoga la demos¬ 
tración de ( 6 ) para el caso 3x3. ■ 
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Cuando se intenta generalizar el teorema 10 a una región en IR 2 o R 3 que no está acotada 
por líneas rectas o planos, se debe enfrentar el problema de cómo definir y calcular su área 
o volumen. Este es un tema estudiado en cálculo, y solamente se indicará la idea básica para 
R 2 . Si R es una región plana que tiene área finita, entonces R se puede aproximar por una 
rejilla de pequeños cuadrados que están dentro de R. Haciendo los cuadrados suficientemente 
pequeños, el área de R se puede aproximar tanto como se quiera mediante la suma de las áreas 
de los pequeños cuadrados. Véase la figura 6. 



FIGURA 6 Aproximación de una región plana mediante la unión 
de cuadrados. La aproximación mejora conforme la rejilla 
se hace más fina. 


Si T es una transformación lineal asociada con una matriz A de 2 x 2, entonces la imagen 
de la región plana R bajo T se aproxima mediante las imágenes de los pequeños cuadrados 
dentro de R. La demostración del teorema 10 señala que cada imagen es un paralelogramo 
cuya área es |det A\ por el área del cuadrado. Si R' es la unión de los cuadrados dentro de 
R, entonces el área de T(R’) es |det ,4 por el área de R’. Véase la figura 7. También, el área 
de T{R') es cercana al área de T(R). Se puede dar un argumento que implique un proceso de 
cálculo de un límite, para justificar la siguiente generalización del teorema 10. 



FIGURA 7 Aproximación de T{R) mediante la unión de paralelogramos. 


Las conclusiones del teorema 10 son válidas si S es una región en R 2 con área finita 
o una región en R 3 con volumen finito. 


EJEMPLOS Sean a y b números positivos. Encuentre el área de la región E acotada por 
la elipse cuya ecuación es 


2 2 

X 1 X<-) 

— + — = 1 

cP b 2 






3.3 EJERCICIOS 

En los ejercicios 1 a 6, utilice la regla de Cramer para calcular las 
soluciones de los sistemas. 

1. 5xi + 7x 2 = 3 2. 4xi + x 2 = 6 

2xi + 4 x 2 = 1 5xi + 2 x 2 = 7 

3. 3xi — 2x 2 =7 4. — 5xi + 3x 2 = 9 

—5xi 4- 6x 2 = —5 3xi — x 2 — —5 

5. 2xi + x 2 =7 6. 2xi + x 2 + x 3 = 4 

—3xi + x 3 = —8 — X\ + 2x 3 = 2 

x 2 + 2x 3 — —3 3x] + x 2 4- 3x 3 — —2 

En los ejercicios 7 a 10, determine los valores del parámetro s 

para los cuales el sistema tiene una solución única, y describa la 
solución. 

7. 6íXi 4- 4x 2 =5 8. 3sxi — 5x 2 = 3 

9xi 4- 2 íx 2 = —2 9xi 4- 5,sx 2 = 2 

9. íXi — 2sx 2 = — 1 10. 2sx¡ 4- x 2 = 1 

3xi 4- 6.sx 2 = 4 3 íXi 4- 6.sx 2 = 2 

En los ejercicios 11 a 16, calcule la adjunta de la matriz dada, y uti¬ 
lice el teorema 8 para dar la inversa de la matriz. 



3 0 0] [124' 

15. -1 10 16. 0 -3 1 

—2 3 2 J |_0 0 3_ 

17. Demuestre que si A es 2 x 2, entonces el teorema 8 da la misma 
fórmula para A -1 que el teorema 4 de la sección 2.2. 

18. Suponga que todas las entradas en A son enteros y det A =1. 
Explique por qué todas las entradas en A -1 son enteros. 

En los ejercicios 19 a 22, encuentre el área del paralelogramo cuyos 

vértices se indican. 

19. (0,0), (5,2), (6,4), (11,6) 

20. (0, 0), (-1, 3), (4, -5), (3, -2) 

21. (-1,0), (0,5), (1,-4), (2, 1) 

22. (0,-2), (6,-1), (-3, 1), (3, 2) 

23. Encuentre el volumen del paralelepípedo con un vértice en el 
origen y vértices adyacentes en (1, 0. —2), (1, 2, 4) y (7, 1, 0). 

24. Encuentre el volunten del paralelepípedo con un vértice en 
el origen y vértices adyacentes en (1, 4, 0), ( — 2, —5, 2) y 
(- 1 , 2 ,- 1 ). 

25. Utilice el concepto de volumen para explicar por qué el deter¬ 
minante de una matriz A de 3 x 3 es cero si y solo si A no es in¬ 
vertible. No recurra al teorema 4 de la sección 3.2. [Sugerencia: 
Piense en las columnas de A], 

26. Sean T : IR™ —> R" una transformación lineal, p un vector y S 
un conjunto en IR™. Demuestre que la imagen de p 4- S bajo T 
es el conjunto trasladado 7\p) 4- T(S ) en IR”. 



Capítulo 3 Ejercicios complementarios 185 


27. Sea S el paralelogramo determinado por los vectores 

y \>2 = 5 ’ y sea A = j 2 ' Calcule 

el área de la imagen de S bajo el mapeo x | —» Ax. 

, í 41 , f ()" 

28. Repita el ejercicio 27 con bi = ^ , b 2 = ^ y 

A-P 2 1 

L 1 

29. Encuentre una fórmula para el área del triángulo cuyos vértices 
son 0 . vi, y V 2 en IR 2 . 

30. Sea R el triángulo con vértices en (x¡, yi), (X 2 , y?) y (X 3 , >> 3 ). 
Demuestre que 

j r*i Vi 1 

{área del triángulo} = - det X 2 y 2 1 

2 L*3 y 3 1 . 

[Sugerencia: Traslade R al origen restando uno de los vértices, 

y considere el ejercicio 29]. 

31. Sea Z’ : [R 3 —> IR 3 la transformación lineal determinada por la 

a 0 0 

matriz A = 0 b 0 , donde a, b y c son números po- 

0 0 c_ 

sitivos. Sea S la bola unitaria, cuya superficie frontera tiene 
la ecuación x 2 + x\ + x\ =■ 1 . 

a) Demuestre que T(S) está acotada por el elipsoide con la 

2 2 2 

• - ^ 1 X*} 

ecuación -4 + -=- -)—f = 1. 
a 2 b 2 c 2 

b ) Con base en el hecho de que el volumen de la bola unitaria 
es 47 t/ 3 , obtenga el volumen de la región acotada por el elip¬ 
soide en el inciso a). 



32. Sea S el tetraedro en IR 3 con vértices en los vectores 0, ei, e 2 y 
e 3 , y sea S' el tetraedro con vértices en los vectores 0. Vi, V 2 y V 3 . 
Véase la figura. 



a) Describa una transformación lineal que mapee a S sobre S'. 

b) Encuentre una fórmula para el volumen del tetraedro S' con¬ 
siderando el hecho de que 

{volumen de S} = (l/3){área de la base} • {altura} 

33. [M] Pruebe la fórmula del teorema 8 para la inversa con una 
matriz aleatoria A de 4 x 4. Utilice un programa de matrices 
para calcular los cofactores de las submatrices 3x3, construya 
la adjunta, y establezca que B = (adj A)/(det A). Luego, encuen¬ 
tre B — inv(A), donde inv(A) es la inversa de A calculada por el 
programa de matrices. Utilice aritmética de punto flotante con 
el número máximo posible de lugares decimales. Informe sus 
resultados. 

34. [M] Pruebe la regla de Cramer con una matriz A de 4 x 4 y un 
vector aleatorio b, 4 x 1. Calcule cada entrada en la solución 
de Ax = b, y compare esas entradas con las correspondientes en 
A~'b. Escriba el comando (u oprima las teclas) para su progra¬ 
ma de matrices que emplea la regla de Cramer para producir la 
segunda entrada de x. 

35. [M] Si su versión de MATLAB tiene el comando flops, úse¬ 
lo para contar el número de operaciones de punto flotante para 
calcular A -1 considerando una matriz aleatoria de 30 X 30. 
Compare este número con el número de flops necesarios para 
construir (adj A)/(det A). 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 

El área de S es det ^ ^ = 14, y det A = 2. De acuerdo con el teorema 10, el área 

de la imagen de S bajo el mapeo x >—» Ax es 

|det A\ ■ {área de 5} = 2 • 14 = 28 


CAPÍTULO 3 EJERCICIOS COMPLEMENTARIOS 


1. Marque cada enunciado como verdadero o falso. Justifique sus 
respuestas. Suponga que todas las matrices son cuadradas. 
a ) Si A es una matriz de 2 x 2 con determinante cero, entonces 
una columna de A es un múltiplo de la otra. 
tí) Si dos filas de una matriz A de 3 x 3 son iguales, entonces 
det A = 0. 

c) Si A es una matriz de 3 x 3, entonces det 5A = 5 det A. 


d) Si A y B son matrices de n x n, con det A = 2 y det B = 3, 
entonces det(A + B) — 5. 

e) Si A es de n x n con det A = 2, entonces det A 3 = 6. 

/) Si B se obtiene al intercambiar dos filas de A, entonces 
detB = det A. 

g) Si B se obtiene multiplicando la fila 3 de A por 5, entonces 
det B = 5 • det A. 
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h) Si B se forma sumando a una fila de A una combinación 
lineal de las otras filas, entonces det B = det A. 

i ) detA r =—detA. 

j) det (—A) = —det A. 

k) det(A r A)>0. 

/) Cualquier sistema de n ecuaciones lineales en n variables se 
puede resolver con la regla de Cramer. 

m) Si u y v están en IR 2 y det [u v] = 10, entonces el área del 
triángulo en el plano con vértices en 0 , u y v es 10 . 

n) Si A 3 = 0, entonces det A = 0. 

o) Si A es invertible, entonces det A -1 = det A. 

p) Si A es invertible, entonces (det A)(det A -1 ) = 1. 

En los ejercicios 2 a 4, utilice operaciones de fila para demostrar que 
todos los determinantes son cero. 


9. Utilice operaciones de fila para demostrar que 
det T = {b — a)(c — a)(c — b) 

10. Sea/(t) = det V, con x\, X 2 , Xj todos distintos. Explique por 
qué f(t) es un polinomio cúbico, demuestre que el coeficiente 
de r 3 es diferente de cero, y encuentre tres puntos sobre la grá¬ 
fica de /. 

11. Calcule el área del paralelogramo definido por los puntos (1,4), 
( — 1, 5), (3, 9) y (5, 8 ). ¿Cómo comprobar que el cuadrilátero 
determinado por estos puntos es realmente un paralelogramo? 

12. Con base en el concepto de área de un paralelogramo, escriba un 
enunciado sobre una matriz A de 2 x 2, que sea válido si y solo 
si A es invertible. 


13. Demuestre que si A es invertible, entonces adj A es invertible, y 


(adjA )- 1 


1 

det A 


A 


12 

13 

14 

1 

a 

b + c 

2. 15 

16 

17 

3. 1 

b 

a + c 

18 

19 

20 

1 

c 

a + b 


abe 

4. a + x b + x c + x 

a + y b + y c + y 


En los ejercicios 5 y 6 , calcule los determinantes. 

9 19 9 9 

9 0 9 9 2 

5. 4 0 0 5 0 

9 0 3 9 0 

6 0 0 7 0 


[Sugerencia: Dadas las matrices B y C, ¿con qué cálculo(s) se 
demostraría que C es la inversa de Bl\. 


14. 


Sean A, B, C, D e I matrices de n x n. Utilice la definición o 
las propiedades de un determinante para justificar las siguientes 
fórmulas. El inciso c) es útil en aplicaciones de valores propios 
(capítulo 5). 


a) det 


’A 0 ' _ 
0 / 



r i 

0' 

= det A 

b) det £ 

D 


= det D 


\1 A 0 . A \ / A TA\ I A B 

c) det c D = (det A)(det D) = det () 


15. Sean A, B, C y D matrices de n x n con A invertible. 

a) Encuentre las matrices Xy Y para producir el bloque de fac- 
torización LU 


4 8 8 8 5 

0 10 0 0 

6. 6 8 8 8 7 

0 8 8 3 0 

0 8 2 0 0 

7. Demuestre que la ecuación de la recta en IR 2 que pasa por los 
puntos distintos (x¡, yf) y (x%, yi) se puede escribir como 

1 x y 

det 1 X\ yi = 0 

_ 1 x 2 V 2 _ 

8 . Encuentre una ecuación de determinantes de 3 x 3, similar a la 
del ejercicio 7, que describa la ecuación de la recta con pendien¬ 
te m y que pasa por (xq, vi). 

Los ejercicios 9 y 10 se relacionan con los determinantes de las si¬ 
guientes matrices de Vandermonde. 



A 5 1 _ I" / Olí - A B 

C D J ~ |_ x / J 1_ ° Y 

y entonces demuestre que 

det ^ B = (detA)-det(D-CA _ 1 5) 

b) Demuestre que si AC = CA, entonces 
det ^ B d =det (AD-CB) 

16. Sea J la matriz de n x n con solo números 1, y considere 
A = (a — b)I + bj; es decir. 



Confirme que det A = (a — b) n 1 [a + (h — 1 )b] como sigue: 
a) Reste la fila 2 de la fila 1, la fila 3 de la fila 2, y así sucesiva¬ 
mente, y explique por qué esto no cambia el determinante de 
la matriz. 
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tí) Con la matriz resultante del inciso a), sume la columna 1 a la 
columna 2 , después sume esta nueva columna 2 a la columna 
3, y así sucesivamente, y explique por qué esto no cambia el 
determinante. 

c) Encuentre el determinante de la matriz resultante en b). 

17. Sea A la matriz original del ejercicio 16, y sean 



Observe que A,ByC son muy semejantes excepto que la prime¬ 
ra columna de A es igual a la suma de las primeras columnas de 
B y C. Una propiedad de linealidad de la función determinante, 
analizada en la sección 3.2, dice que det A = det B + det C. Uti¬ 
lice este hecho para probar la fórmula del ejercicio 16 mediante 
inducción sobre el tamaño de la matriz A. 

18. [M] Aplique el resultado del ejercicio 16 para encontrar los de¬ 
terminantes de las siguientes matrices, y confirme sus respues¬ 
tas utilizando un programa de matrices. 



19. [M] Utilice un programa de matrices para calcular los determi¬ 
nantes de las siguientes matrices. 



' 11111 ' 

1 2 2 2 2 

1 2 3 3 3 

1 2 3 4 4 

_l 2 3 4 5_ 

Utilice los resultados para hacer una conjetura sobre el de¬ 
terminante de la matriz que se presenta a continuación, y confir¬ 
me la conjetura utilizando operaciones de fila para evaluar ese 
determinante. 

‘1 1 1 ••• 1 ' 

1 2 2 ••• 2 

1 2 3 ••• 3 


1 2 3 ••• n J 

20. [M] Aplique el método del ejercicio 19 para hacer una conjetura 
sobre el determinante de 



Justifique su conjetura. [Sugerencia: Considere el ejercicio 14c) 
y el resultado del ejercicio 19]. 
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Espacios vectoriales 



EJEMPLO INTRODUCTORIO 

Vuelo espacial y sistemas 
de control 

Con sus 12 pisos de altura y un peso de 75 toneladas, el 
Columbio se elevó majestuosamente de la plataforma de 
lanzamiento en una fresca mañana de Domingo de Ramos 
en abril de 1981. Producto de 10 años de una intensa labor 
de investigación y desarrollo, el primer transbordador 
espacial de Estados Unidos fue un triunfo de diseño de la 
ingeniería de sistemas de control, en el que participaron 
varias ramas de la ingeniería: aeronáutica, química, 
eléctrica, hidráulica y mecánica. 

Los sistemas de control de la nave espacial son abso¬ 
lutamente esenciales para el vuelo. Como el transbordador 
tiene un fuselaje inestable, requiere de una monitorización 
computarizada constante durante el vuelo atmosférico. 

El sistema de control de vuelo envía una secuencia de 
comandos a las superficies de control aerodinámico y 
a 44 pequeños impulsores de propulsión a chorro. 

En la figura 1 se muestra un típico sistema de circuito 


cerrado de retroalimentación que controla el cabeceo del 
transbordador durante el vuelo. (El cabeceo es el ángulo 
de elevación del cono de proa). Los símbolos de unión (®) 
indican dónde se añaden las señales de varios sensores a 
las señales de la computadora que fluyen a través de la parte 
superior de la figura. 

Matemáticamente, las señales de entrada y salida a un 
sistema de ingeniería son funciones. En las aplicaciones, es 
importante que estas funciones se puedan sumar, como se 
muestra en la figura 1. y multiplicarse por escalares. Estas 
dos operaciones con las funciones tienen propiedades alge¬ 
braicas que son completamente análogas a las operaciones 
de suma de vectores en R" y a la multiplicación de un vec¬ 
tor por un escalar, como se verá en las secciones 4.1 y 4.8. 
Por esta razón, el conjunto de todas las entradas posibles 
(funciones) se denomina espacio vectorial. Los fundamentos 
matemáticos para la ingeniería de sistemas se basan en espacios 



FIGURA 1 Sistema de control del cabeceo para el transbordador espacial. ( Fuente: Adaptado de Space Shuttle 
GN&C Operations Manual. Rockwell International, © 1988). 
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vectoriales de funciones, y en este capítulo 4 se amplía la 
teoría de los vectores en R" para incluir dichas funciones. 


Más adelante, veremos cómo surgen otros espacios vectoriales 
en ingeniería, física y estadística. 

I WEB 


Las “semillas” matemáticas sembradas en los capítulos 1 y 2 germinan y comienzan a florecer 
en este capítulo. La belleza y el poder del álgebra lineal se apreciarán más claramente cuando 
el lector considere a R" solo como uno de tantos espacios vectoriales que surgen de forma 
natural en problemas aplicados. En realidad, el estudio de espacios vectoriales no es muy 
diferente del propio estudio de R", porque usted podrá utilizar su experiencia geométrica con 
R 2 y R 3 para visualizar muchos conceptos generales. 

Comenzando con las definiciones básicas en la sección 4.1, el marco teórico de los espa¬ 
cios vectoriales se desarrolla gradualmente a lo largo del capítulo. Uno de los objetivos de las 
secciones 4.3 a 4.5 es demostrar cuán estrechamente se parecen otros espacios vectoriales a 
R". En la sección 4.6 se estudiará el rango, uno de los temas más importantes de este capítulo, 
utilizando la terminología de espacio vectorial para vincular datos importantes de las matrices 
rectangulares. En la sección 4.8 se aplica la teoría del capítulo a las señales discretas y ecua¬ 
ciones en diferencias utilizadas en los sistemas de control digital, como en el transbordador 
espacial. Las cadenas de Markov, en la sección 4.9, representan un cambio de ritmo respecto 
de las secciones más teóricas del capítulo y dan buenos ejemplos para los conceptos que se 
introducirán en el capítulo 5. 


4.1 


ESPACIOS Y SUBESPACIOS VECTORIALES 


Gran parte de la teoría en los capítulos 1 y 2 se basa en ciertas propiedades algebraicas senci¬ 
llas y evidentes de R", que se listan en la sección 1.3. De hecho, muchos otros sistemas ma¬ 
temáticos tienen las mismas propiedades. Las propiedades específicas de interés se incluyen 
en la siguiente definición. 


DEFINICION Un espacio vectorial es un conjunto no vacío V de objetos, llamados vectores , en el 
que están definidas dos operaciones, llamadas suma y multiplicación por escalares 
(números reales), sujetas a los 10 axiomas (o reglas) que se listan a continuación. 1 
Los axiomas deben ser válidos para todos los vectores u, v, w en V, y para todos los 
escalares cy d. 

1. La suma de u y v, denotada con u + v, está en V. 

2. u + v = v + u. 

3. (u + v) + w = u + (v + w). 

4. Hay un vector cero (0) en V tal que u + 0 = u. 

5. Para cada u en V, existe un vector — u en V tal que u + (—u) = 0. 

6. El múltiplo escalar de u por c, que se denota con cu, está en V. 

7. c(u + v) = cu + cv. 

8. (c + í/)u = cu + du. 

9. c(d u) = (cd) u. 

10. lu = u. 


1 Técnicamente, V es un espacio vectorial real. Toda la teoría en este capítulo también es válida para un espacio 
vectorial complejo en el que los escalares son números complejos. Trataremos brevemente este asunto en el capí¬ 
tulo 5. Hasta entonces, se supone que todos los escalares son reales. 
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Utilizando tan solo estos axiomas, es posible demostrar que el vector cero en el axioma 4 
es único, y el vector — u, llamado el negativo de u, en el axioma 5 es único para toda u en V. 
Véase los ejercicios 25 y 26. Demostraciones de los hechos que se presentan a continuación 
se describen en los ejercicios: 


Para cada u en V y escalar c, 




O 

II 

s 

o 

(1) 


o 

II 

o 

o 

(2) 


-11 = (-1)11 

(3) 


’/ 



FIGURA 1 


EJEMPLO 1 Los espacios IR", donde « > 1, son los ejemplos principales de espacios 
vectoriales. La intuición geométrica desarrollada para le ayudará a entender y visualizar 
muchos conceptos en todo el capítulo. ■ 

EJEMPLO 2 Sea V el conjunto de todas las flechas (segmentos de recta dirigidos) en el 
espacio tridimensional; se considera que dos flechas son iguales si tienen la misma longitud y 
la punta en la misma dirección. Defina la suma por la regla del paralelogramo (de la sección 
1.3), y para cada v en V, defina cv como la flecha cuya longitud es Id por la longitud de v, 
apuntando en la misma dirección que v si c > 0 y, en caso contrario, apuntando en la direc¬ 
ción opuesta. (Véase la figura 1). Demuestre que V es un espacio vectorial. Este espacio es un 
modelo común de los problemas físicos de varias fuerzas. 

SOLUCIÓN La definición de V es geométrica, utilizando los conceptos de longitud y direc¬ 
ción. Ningún sistema de coordenadas xyz está implicado. Una flecha de longitud cero es un 
punto único y representa el vector cero. El negativo de v es (— l)v. Por lo tanto, los axiomas 
1, 4, 5, 6 y 10 son evidentes. El resto se comprobará con geometría. Por ejemplo, véase las 
figuras 2 y 3. ■ 



FIGURA 2 u + v = v + u. 



FIGURA 3 (u + v) + w = u + (v + w). 


EJEMPLO 3 Sea § el espacio de todas las secuencias doblemente infinitas de números 
(que generalmente se anotan en una fila más que en una columna): 

{»} = (...,y- 2 ,y-i,>’o») , i» 3 ; 2 , •■■) 

Si {z,t} es otro elemento de §, entonces la suma {y^} + {z*} es la sucesión {y^ + Zk} for¬ 
mada por la suma de los términos correspondientes de {v¿,} y ¡ z,k }■ El múltiplo escalar c{y k ] 
es la sucesión {c_y*}. Los axiomas de espacio vectorial se comprueban en la misma forma 
que para R". 

Los elementos de § surgen en ingeniería, por ejemplo, cuando una señal se mide (o se 
muestrea) en tiempos discretos. Una señal puede ser eléctrica, mecánica, óptica, etcétera. 
Los sistemas de control principal del transbordador espacial, que se mencionaron en la in¬ 
troducción del capítulo, usan señales discretas (o digitales). Por conveniencia, llamaremos 
a § el espacio de señales (discretas de tiempo). Una señal se puede visualizar con una gráfica 
como la que se ilustra en la figura 4. ■ 
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. II I I I II11 I I Tt. 

-5 0 5 10 ' I | I 

FIGURA 4 Una señal discreta de tiempo. 


EJEMPLO 4 Para n > 0, el conjunto P„ de polinomios de grado n o menor consiste en 
todos los polinomios de la forma 

p(t) = ao + Qit + ait 2 + ■■■ +a„t" (4) 

donde los coeficientes a {h .... a„ y la variable t son números reales. El grado de p es la ma¬ 
yor potencia de t en (4) cuyo coeficiente no es cero. Si p(f) = a ü A 0, el grado de p es cero. 
Si todos los coeficientes son iguales a cero, p se llama el polinomio cero. El polinomio cero 
está incluido en P„, a pesar de que su grado, por razones técnicas, no esté definido. 

Si p está dada por la ecuación (4) y si q(f) = /; () + b¡t + ■■■ + b n t'\ entonces la suma 
p + q se define mediante 

(p + q)(0 = PÍO + q(0 

= (ciq 4- ¿ o ) + (ü\ + b\)t + • • • + {a n + b„)t" 

El múltiplo escalar cp es el polinomio definido por 

(cp)(0 = cp(0 = ca 0 + (cai)í -I-h (ca„)t n 

Estas definiciones satisfacen los axiomas 1 y 6, ya que p + q y cp son polinomios de 
grado igual o menor que n. Los axiomas 2, 3, y 7 a 10 son consecuencias de las propie¬ 
dades de los números reales. Evidentemente, el polinomio cero actúa como vector cero en 
el axioma 4. Por último, (— l)p actúa como el negativo de p, por lo que el axioma 5 está sa¬ 
tisfecho. Así, P„ es un espacio vectorial. 

Se utilizan espacios vectoriales P„ para varias n, por ejemplo, en el análisis de tendencia 
estadística de datos, que se analiza en la sección 6.8. ■ 


f+g 

f 

g 

0 

FIGURA 5 

La suma de dos vectores 
(funciones). 


EJEMPLO 5 Sea V el conjunto de todas las funciones de valores reales definidas en un 
conjunto D. (Por lo general, D es el conjunto de números reales o algún intervalo en la recta 
real). Las funciones se suman en la forma habitual: f + g es la función cuyo valor en t en el 
dominio D es f(f) + g(r). Asimismo, para un escalar c y una f en V, el múltiplo escalar cf es 
la función cuyo valor en t es cf(í). Por ejemplo, si D = IR, f(í) = 1 + sen 2 1, y g(í) = 2 + ,5t, 
entonces 

(f + g)(r) = 3 + sen 2 1 + .51 y (2g)(f) =4 + t 

Dos funciones en V son iguales si y solo si sus valores son iguales para toda t en D. 
Por lo tanto, el vector cero en V es la función igual a cero, f(f) = 0 para toda t, y el negativo 
de f es (— l)f. Como es evidente, los axiomas 1 y 6 son ciertos, y los otros axiomas se dedu¬ 
cen de las propiedades de los números reales, por lo que V es un espacio vectorial. ■ 

Es importante pensar en cada función en el espacio vectorial V del ejemplo 5 como un 
objeto único, un solo “punto” o un vector en el espacio vectorial. La suma de dos vectores 
f y g (funciones en V, o elementos de cualquier espacio vectorial) se puede visualizar como 
en la figura 5, ya que esto le ayudará a aplicar a un espacio vectorial general la intuición 
geométrica que ha desarrollado al trabajar con el espacio vectorial IR". Consulte la Guía de 
estudio como ayuda conforme aprenda a adoptar este punto de vista más general. 
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DEFINICIÓN 


H 

0 

V 

FIGURA 6 

Un subespacio de V. 



FIGURA 7 

El plano X\X 2 como un subespacio 
de IR 3 . 


Subespacios 

En muchos problemas, un espacio vectorial se compone de un subconjunto adecuado de vec¬ 
tores de un espacio vectorial más grande. En este caso, solo se deben comprobar tres de los 10 
axiomas de espacio vectorial, y el resto se satisfacen de manera automática. 


Un subespacio de un espacio vectorial V es un subconjunto H de V que tiene tres pro¬ 
piedades: 

a) El vector cero de V está en f l? 

b ) H es cerrado bajo la suma de vectores. Es decir, por cada u y v en H, la suma u + v 
está en H. 

c) H es cerrado bajo la multiplicación por escalares. Es decir, para cada u en H y cada 
escalar c, el vector cu está en H. 


Las propiedades á),b) y c) garantizan que un subespacio H de V sea en sí mismo un espa¬ 
cio vectorial bajo las operaciones de espacio vectorial ya definidas en V. Para comprobar esto, 
observe que las propiedades a), b ) y c) corresponden a los axiomas 1, 4 y 6. Los axiomas 2, 
3 y 7 a 10 son automáticamente verdaderos en H, ya que se aplican a todos los elementos de 
V, incluidos los de H. El axioma 5 también es verdadero en H, ya que si u está en //, entonces 
(— l)u está en H de acuerdo con la propiedad c), y sabemos a partir de la ecuación (3) de la 
página 191 que ( — l)u es el vector — u en el axioma 5. 

Así, cada subespacio es un espacio vectorial. Por el contrario, todo espacio vectorial es un 
subespacio (de sí mismo y, posiblemente, de otros espacios más grandes). El término subespa¬ 
cio se utiliza cuando al menos dos espacios vectoriales están en mente, con uno dentro del otro, 
y la frase subespacio de V identifica a V como el espacio más grande. (Véase la figura 6). 

EJEMPLO 6 El conjunto que consta solo del vector cero en un espacio vectorial V es un 
subespacio de V, llamado subespacio cero, y se representa como ¡0}. ■ 

EJEMPLO 7 Sea P el conjunto de todos los polinomios con coeficientes reales, con ope¬ 
raciones en R definidas como en las funciones. De esta forma, P es un subespacio del espacio 
de todas las funciones de valores reales definidas en IR. Además, para cada n > 0, P„ es un 
subespacio de P, ya que P„ es un subconjunto de P que contiene el polinomio cero; la suma 
de dos polinomios en P„ también está en P„, y un múltiplo escalar de un polinomio en P„ 
también está en P„. ■ 


EJEMPLO 8 El espacio vectorial R 2 no es un subespacio de R 3 porque R 2 ni siquiera es 
un subconjunto de R 3 . (Todos los vectores en R 3 tienen tres entradas, mientras que los vecto¬ 
res de R 2 tienen solo dos). El conjunto 


H = 



: s y t son reales 


es un subconjunto de R 3 que se “ve” y “actúa” como R 2 , aunque lógicamente es distinto de 
R 2 . Véase la figura 7. Demuestre que H es un subespacio de R 3 . 

SOLUCIÓN El vector cero está en H, y H es cerrado bajo la suma de vectores y la multi¬ 
plicación escalar debido a que estas operaciones sobre los vectores de H siempre producen 
vectores cuyas terceras entradas son iguales a cero (y, por lo tanto, pertenecen a H). Por con¬ 
siguiente, H es un subespacio de R 3 . ■ 


2 Algunos libros remplazan la propiedad a) en esta definición por el supuesto de que H no es vacío. Así, a) se puede 
deducir a partir de c) y el hecho de que Ou = 0. Pero la mejor manera de someter a prueba un subespacio es bus¬ 
car primero al vector cero. Si 0 está en H, entonces se deben revisar las propiedades b) y c). Si 0 no está en H, en¬ 
tonces H no puede ser un subespacio y no se necesita comprobar las otras propiedades. 
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H 


FIGURA 8 

Una recta que no es un espacio 
vectorial. 



FIGURA 9 

Un ejemplo de un subespacio. 


TEOREMA 1 


EJEMPLO 9 Un plano en IR 3 que no pasa por el origen no es un subespacio de R 3 , por¬ 
que el plano no contiene el vector cero de R 3 . Del mismo modo, una recta en R 2 que no 
pasa por el origen, como en la figura 8, no es un subespacio de R 2 . ■ 


Un subespacio generado por un conjunto 

El siguiente ejemplo ilustra una de las formas más comunes de describir un subespacio. Como 
en el capítulo 1, el término combinación lineal se refiere a cualquier suma de los múlti¬ 
plos escalares de vectores, y Gen {vi,..., v ;) } denota el conjunto de todos los vectores que 
se pueden escribir como combinaciones lineales de Vi,..., \ p . 

EJEMPLO 10 Dados vi y V 2 en un espacio vectorial V, sea H = Gen {vi, V 2 }. Demuestre 
que H es un subespacio de V. 

SOLUCION El vector cero está en H, ya que 0 = Ovi + Ov' 2 . Para demostrar que H es cerrado 
bajo la suma de vectores, tome dos vectores arbitrarios en H, por ejemplo, 

U = S 1 V 1 + S 2 \ 2 y w — f l v l + f 2V2 

Por los axiomas 2, 3 y 8 para el espacio vectorial V, 

u + w = (.SiVi + s 2 \ 2 ) + (Í1V1 + t 2 \ 2 ) 

= Cu + ?i)vi + (s 2 + r 2 )\i 

Así que u + w está en H. Además, si c es un escalar cualquiera, entonces por los axiomas 
7 y 9, 


cu = c (u v 1 + S 2 V 2 ) = (cu)vi + (cs 2 )y 2 

lo que demuestra que cu está en H, y H es cerrado bajo la multiplicación por escalares. 
Por lo tanto, H es un subespacio de V. ■ 

En la sección 4.5, veremos que todo subespacio de R 3 distinto de cero, que no sea 
R 3 mismo, es Gen {vi, V 2 } para algunos vi y V 2 linealmente independientes o Gen {v} para 
v ¥= 0. En el primer caso, el subespacio es un plano que pasa por el origen; en el segundo 
caso, se trata de una recta que pasa por el origen. (Véase la figura 9). Es útil tener en mente 
estas imágenes geométricas, incluso para un espacio vectorial abstracto. 

El argumento en el ejemplo 10 se puede generalizar fácilmente para comprobar el si¬ 
guiente teorema. 


Si Vi,..., \ p están en un espacio vectorial V, entonces Gen {vi,..., v p ¡ es un subes¬ 
pacio de V. 


Se llama Gen {vi,..., v /; ¡ al subespacio generado por {vi,..., v /; }. Dado un subes¬ 
pacio H de V, un conjunto generador para H es un conjunto {vi,..., v /; } en H tal que 
H = Gen {Vi,..., v^}. 

El siguiente ejemplo muestra cómo utilizar el teorema 1. 

EJEMPLO 11 Sea H el conjunto de todos los vectores de la forma (a — 3b, b — a, 
a, b), donde ay b son escalares arbitrarios. Es decir, sea H = {(a — 3b, b — a, a, b): a y b 
en R¡. Demuestre que H es un subespacio de R 4 . 
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SOLUCIÓN Represente los vectores en H como vectores columna. Así, un vector arbitrario 
en H tiene la forma 


a — 3 b 


1 _ 


3~ 

b — a 


-1 


1 


= a 

1 

+ b 

0 

a 


h 


0 


1 


í t 

Vi v 2 


Este cálculo muestra que H = Gen {vi, V 2 }, donde y V 2 son los vectores indicados anterior¬ 
mente. Por lo tanto, H es un subespacio de IR 4 de acuerdo con el teorema 1. ■ 

El ejemplo 11 muestra una técnica útil para expresar un subespacio H como el conjunto 
de combinaciones lineales de una pequeña colección de vectores. Si H = Gen ¡V|,..., v ;) }, po¬ 
demos pensar en los vectores Vi,..., v ; , del conjunto generador como "asas’' que nos permiten 
sujetar el subespacio H. Cálculos con un número infinito de vectores en H con frecuencia se 
reducen a operaciones con un número finito de vectores en el conjunto generador. 

EJEMPLO 12 Determine qué valor(es) de h hará(n) que y sea un subespacio de IR 3 
generado por Vi, V 2 , V 3 , si 



1 


r 5i 


"-3 


-4" 

Vi = 

-1 

-2 

, V 2 = 

1 

1 1 
_1 

, V3 = 

1 

0 

II 

3 

h 


SOLUCIÓN Esta pregunta es el problema de práctica 2 en la sección 1.3, que aquí se mo¬ 
dificó utilizando el término subespacio en vez de Gen {vi, V2, V3}. La solución obtenida ahí 
muestra que y está en Gen { Vi, V2, V3} si y solo si h = 5 . Vale la pena revisar esta solución 
ahora, junto con los ejercicios 11 a 16y 19a21 de la sección 1.3. ■ 

Aunque muchos espacios vectoriales en este capítulo son subespacios de R", es importan¬ 
te considerar que la teoría abstracta se aplica a otros espacios vectoriales. Espacios vectoriales 
de funciones surgen en muchas aplicaciones, y más adelante se tratarán con más detalle. 


PROBLEMAS DE PRÁCTICA 

1. Demuestre que el conjunto H de todos los puntos en R 2 de la forma (3,v, 2 + 5 s) no es un 
espacio vectorial, al mostrar que no es cerrado bajo la multiplicación escalar. (Encuentre 
un vector específico u en H y un escalar c tal que cu no está en //). 

2. Sea W = Gen {Vi,..., v ; ,}, donde Vi,..., v ; , se encuentran en un espacio vectorial V. 
Demuestre que v¿. está en W para 1 < k < p. [Sugerencia: Escriba primero una ecuación 
que demuestre que V| está en W. Después, ajuste su notación para el caso general]. 

WEB I 


4.1 EJERCICIOS 


1. Sea V el primer cuadrante en el plano xy; es decir, sea 


2. Sea W la unión del primer y tercer cuadrantes en el plano xy. 


V 



: x > 0, y > 0 


Es decir, sea W = 



: xy > 0 


a) Si u y v están en V, ¿está u + v en V"? ¿Por qué? a) Si u está en W y c es cualquier escalar, ¿está cu en W1 

b) Encuentre un vector específico u en V y un escalar específico ¿P° r qué? 

c tal que cu no esté en V. (Esto es suficiente para demostrar 

que Vno es un espacio vectorial). 
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fe) Encuentre dos vectores específicos u y v tales que u + v no 
esté en W. Esto es suficiente para demostrar que W no es 
un espacio vectorial. 


3. Sea H el conjunto de puntos en el interior y sobre el círculo uni¬ 


tario en el plano xy. Es decir, sea H 


: x + y < 1 . 


Encuentre un ejemplo específico —dos vectores o un vector y 
un escalar—, que demuestre que H no es un subespacio de IR 2 . 


4. Construya una figura geométrica que ilustre por qué una recta 
en IR 2 que no pasa por el origen no es cerrada bajo la suma de 
vectores. 


En los ejercicios 5 a 8, determine si el conjunto dado es un subespa¬ 
cio de P„ para un valor adecuado de n. Justifique sus respuestas. 

5. Todos los polinomios de la forma p(f) = at 2 , donde a se encuen¬ 
tra en IR. 

6. Todos los polinomios de la forma p(f) — a + t 2 , donde a se 
encuentra en IR. 


7. Todos los polinomios de grado 3 como máximo, con números 
enteros como coeficientes. 


En los ejercicios 15 a 18, sea W el conjunto de todos los vectores 
de la forma indicada, donde a, b y c representan números reales 
arbitrarios. En cada caso, encuentre un conjunto S de vectores que 
genere VE o dé un ejemplo para demostrar que W no es un espacio 
vectorial. 


15. 


2 a + 3 b 
-1 

2 a — 5b 


16. 


1 

3 a — 5b 
3 b + 2a 


17. 


2a — b 
3b — c 
3c — a 
3b 


4íí + 3b 
0 

a + 3b + c 
3b-2c 


19. Si una masa m se coloca en el extremo de un resorte, y si se tira 
de la masa hacia abajo y luego se suelta, el sistema masa-resorte 
comenzará a oscilar. El desplazamiento y de la masa desde su 
posición de reposo está dado por una función de la forma 

y(f) = c\ eos cot + C 2 sen a>t (5) 


8. Todos los polinomios en P„ tales que p(0) = 0. 

9. Sea H el conjunto de todos los vectores de la forma 


-2 1 
51 
31 


10 . 


Encuentre un vector v en IR 3 tal que H = Gen { v }. ¿Por qué esto 
demuestra que H es un subespacio de IR 3 ? 


Sea H el conjunto de todos los vectores de la forma 


3 1 
0 

—It 


donde t es cualquier número real. Demuestre que H es un subes¬ 
pacio de IR 3 . (Utilice el método del ejercicio 9). 


11. Sea W el conjunto de todos los vectores de la forma 


2b + 3c 
-b 
2c 


, donde b y c son arbitrarios. Encuentre los vec¬ 


tores u y v tales que W = Gen ¡u, v). ¿Por qué esto demuestra 
que W es un subespacio de IR 3 ? 


12. Sea W el conjunto de todos los vectores de la for- 
' 2s + At ' 

2s 

„ . Demuestre que W es un subespacio de IR 4 . 

2s — 31 

51 

(Utilice el método del ejercicio 11). 



1 " 


~2~ 


"4~ 


' 3 ' 

13. Sea Vi = 

0 

. v 2 = 

1 

. v 3 = 

2 

yw = 

1 


-1 


3 


6 


2 


a) ¿Está w en {vi, v 2 , V3)? ¿Cuántos vectores se encuentran 
en ¡V!, v 2 , v 3 }? 

b) ¿Cuántos vectores están en Gen {vi, v 2 , V3}? 

c) ¿w es el subespacio generado por {vi, v 2 , v 3 }? ¿Por qué? 


14. Sea vi, v 2 , V3 como en el ejercicio 13, y sea w = 

¿Está w en el subespacio generado por {vi, v 2 , v 3 }? ¿Por qué? 


1 

3 

14 


donde co es una constante que depende del resorte y la masa. 
(Véase la figura que se muestra a continuación). Demuestre que 
el conjunto de todas las funciones descritas en la ecuación (5) 
(con co fija y ci y c 2 arbitrarias) es un espacio vectorial. 



20. El conjunto de todas las funciones de valor real continuas y de¬ 
finidas en un intervalo cerrado [a, b\ en IR se denota mediante 
C[a, b]. Este conjunto es un subespacio del espacio vectorial de 
todas las funciones de valor real definidas en [a, b\. 

a) ¿Qué hechos acerca de las funciones continuas se deberían 
someter a prueba para demostrar que C[a, b] es en realidad 
el subespacio que se afirma? (Estos hechos se suelen tratar 
en una clase de cálculo). 

fe) Demuestre que {f en C[a, b ] : f(a) = fífe) ¡ es un subespacio 
de C[a, fel- 

Para enteros positivos fijos m y n, el conjunto M mxn de todas las ma¬ 
trices de m x n es un espacio vectorial, bajo las operaciones habi¬ 
tuales de suma de matrices y multiplicación por escalares reales. 

21. Determine si el conjunto H de todas las matrices de la forma 

0 j es un subespacio de M 2x2 . 

22. Sea F una matriz fija de 3 x 2, y sea H el conjunto de todas las 

matrices A en M 2X 4 con la propiedad de que FA = 0 (la matriz 
cero en Determine si H es un subespacio de M 2X 4 . 
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En los ejercicios 23 y 24, marque cada enunciado como verdadero o 
falso. Justifique sus respuestas. 

23. a ) Si f es una función en el espacio vectorial V de todas las 

funciones de valores reales en IR y si f (t) = 0 para alguna t, 
entonces f es el vector cero en V. 

b ) Un vector es una flecha en el espacio tridimensional. 

c) Un subconjunto H de un espacio vectorial V es un subes¬ 
pacio de V si el vector cero está en H. 

d) Un subespacio también es un espacio vectorial. 

e) Las señales analógicas se utilizan en los sistemas de control 
principal del transbordador espacial, mencionado en la in¬ 
troducción al capítulo. 

24. a) Un vector es cualquier elemento de un espacio vectorial. 

b ) Si u es un vector en un espacio vectorial V, entonces ( — l)u 
es igual al negativo de u. 

c) Un espacio vectorial es un subespacio. 

d) R 2 es un subespacio de R\ 

e) Un subconjunto H de un espacio vectorial V es un subespa¬ 
cio de V si se cumplen las siguientes condiciones: i. el vector 
cero de V está en H, i¡. u, v y u + v en H. y iii. c es un escalar 
y cu está en H. 

Los ejercicios 25 a 29 muestran cómo se pueden utilizar los axiomas 
de un espacio vectorial V para demostrar las propiedades elementales 
descritas después de la definición de un espacio vectorial. Complete 
los espacios en blanco con los números del axioma adecuado. De 
acuerdo con el axioma 2, los axiomas 4 y 5 implican, respectivamen¬ 
te, que 0 + u = u y — u + u = 0 para toda u. 

25. Complete la siguiente demostración de que el vector cero 
es único. Suponga que w en V tiene la propiedad de que u + 
w = w + u = u para toda u en V. En particular, 0 + w = 0. 

Sin embargo, 0 + w = w, de acuerdo con el axioma_. 

Por lo tanto, w = 0 + w = 0. 

26. Complete la siguiente demostración de que —u es el único 
vector en V tal que u + (— u) = 0. Suponga que w satisface 
u + w = 0. Sumando — u en ambos lados, se tiene 

(-u) + [u + w] = ( u) + 0 

[(— u) + u] + w = (— u) + 0 según el axioma_ a) 

0 + w = (—u) + 0 según el axioma_ b) 

w = —u según el axioma_ c) 

27. Complete los números de axioma que faltan en la siguiente de¬ 
mostración de que Ou = 0 para cada u en V. 

Ou = (0 + 0)u = Ou + Ou según el axioma_ a) 

Sume el negativo de Ou en ambos lados: 

Ou + (-0u) = [Ou + Ou] + (-0u) 

Ou + (— Ou) = Ou + [Ou + (— 0u)] según el axioma_ b) 

0 = Ou + 0 según el axioma_ c) 

0 = Ou según el axioma_ d) 

28. Complete los números de axioma que faltan en la siguiente 
demostración de que 


cO = 0 para cada escalar c. 

cO = c(0 + 0) según el axioma_ a) 

= cO + cO según el axioma_ b) 

Sume el negativo de cO en ambos lados: 

cO + (—c0) = [c0 + cO] + (—cO) 

cO + (—c0)=c0 + [cO 4- (—cO)] según el axioma_ c) 

0=c0 + 0 según el axioma_ d) 

0=c0 según el axioma_ e) 

29. Demuestre que (— l)u = — u. [Sugerencia: Demuestre que 
u + (— l)u = 0. Utilice algunos axiomas y los resultados de 
los ejercicios 27 y 26]. 

30. Suponga que cu = 0 para algún escalar c distinto de cero. 
Demuestre que u = 0. Mencione los axiomas o las propiedades 
que utilice. 

31. Sean u y v vectores en un espacio vectorial V, y sea H cual¬ 
quier subespacio de V que contiene a u y v. Explique por qué H 
también contiene a Gen {u, v¡. Esto demuestra que Gen {u, v) 
es el menor subespacio de V que contiene a u y v. 

32. Sean H y K subespacios de un espacio vectorial V. La inter¬ 
sección de H y K. que se representa como H fl K, es el conjun¬ 
to de v en V que pertenece tanto a H como K. Demuestre que 
H (~l K es un subespacio de V. (Véase la figura). Dé un ejemplo 
en R 2 para demostrar que la unión de dos subespacios no es, en 
general, un subespacio. 



33. Dados los subespacios H y K de un espacio vectorial V, la suma 
de H y K, que se escribe como H + K, es el conjunto de todos 
los vectores en V que se pueden representar como la suma de 
dos vectores, uno en H y el otro en K; es decir, 

H + K = {w:w = u + v para alguna u en H 
y alguna v en K] 

a) Demuestre que H + K es un subespacio de V. 

b) Demuestre que H es un subespacio de H + K y K es un 
subespacio de H + K. 

34. Suponga que uj,..., u ; , y Vi,..., \ q son vectores en un espacio 
vectorial V , y sea 

H = Gen ]ui,..., u^} y K = Gen {vi,..., v ? ) 

Demuestre que H + K = Gen {ui,..., u p , Vi,..., v 9 ¡. 
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35. [M] Demuestre que w está en el subespacio de R 4 generado por 
vi, V2, V3, donde 



9" 


8 " 


"-4“ 


-T 


-4 


-4 


3 


6 

w = 

-4 

.V! = 

-3 

. v 2 = 

-2 

, v 3 = 

-5 


7 


9 


-8 


-18 


36. [M] Determine si y está en el subespacio de R 4 generado por las 
columnas de A, donde 


-4 


y = 


-8 


6 

-5 



-9 

-6 

3 

-9 


37. [M] El espacio vectorial H = Gen {1, eos 2 ?, eos 4 ?, eos 6 ?) con¬ 
tiene al menos dos funciones interesantes que se utilizarán en un 


ejercicio posterior: 

f(?) = 1 — 8 eos 2 ? + 8 eos 4 ? 
g(?) = —1 + 18 eos 2 1 — 48 eos 4 ? + 32 eos 6 ? 

Estudie la gráfica de f para 0 < t < 2 tt, e infiera una fórmula 
sencilla para f(?). Verifique su suposición mediante la represen¬ 
tación gráfica de la diferencia entre 1 + f(?) y su fórmula para 
f(í). (Se espera que vea la función constante 1). Repita el pro¬ 
cedimiento para g. 

38. [M] Repita el ejercicio 37 para las funciones 
f(?) = 3 sen t — 4 sen 3 ? 
g(?) =1 — 8 sen 2 t + 8 sen 4 ? 
h(?) = 5 sen t — 20 sen 3 ? + 16 sen 5 ? 
en el espacio vectorial Gen {1, sen ?, sen 2 ?,..., sen 5 ?). 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Tome cualquier u en H, digamos, u 


, y tome cualquier c ¥= 1, por ejemplo, c = 2. 


Así, cu = 


6 

14 


. Si esto se encuentra en H, entonces hay alguna s tal que 


3 s 


6" 

2 + 5í 


14 


Es decir, s = 2 y s = 12/5, lo que es imposible. Así que 2u no está en H, y H no es un 
espacio vectorial. 

2. Vi = lvi + OV 2 + ••• + 0v ; ,. Esta ecuación expresa a vi como una combinación lineal 
de Vi,..., \ p , por lo que vi se encuentra en W. En general, v/ ; está en W, ya que 

v* = Ovi 4-b 0v¿_i + lv A . + Ova+i -I-b 0v^ 


4.2 ESPACIOS NULOS, ESPACIOS COLUMNA Y TRANSFORMACIONES LINEALES 


En las aplicaciones del álgebra lineal, los subespacios de R" generalmente se presentan en 
una de dos maneras: 1. como el conjunto de todas las soluciones a un sistema de ecuaciones 
lineales homogéneas, o 2. como el conjunto de todas las combinaciones lineales de ciertos 
vectores específicos. En esta sección, se comparan estas dos descripciones de subespacios, 
lo que nos permitirá practicar el uso del concepto de subespacio. En realidad, como pronto 
descubrirá, hemos trabajado con subespacios desde la sección 1.3. La principal novedad aquí 
es la terminología. La sección concluye con un análisis acerca del núcleo y el rango de una 
transformación lineal. 

El espacio nulo de una matriz 

Considere el siguiente sistema de ecuaciones homogéneas: 

A'l — 3.V2 — 2X3 = o 

—5x'i -b 9.Y2 + X3 = 0 


(1) 
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DEFINICIÓN 


TEOREMA 2 


En forma de matriz, este sistema se representa como Ax = 0, donde 



( 2 ) 


Recordemos que el conjunto de todas las x que satisfacen (1) se llama el conjunto solución 
del sistema (1). Con frecuencia es conveniente relacionar este conjunto directamente con la 
matriz A y la ecuación Ax = 0. El conjunto de x que satisfacen Ax = 0 se denomina el espacio 
nulo de la matriz A. 


El espacio nulo de una matriz A de m x n, que se denota como Nul A, es el conjunto de 
todas las soluciones de la ecuación homogénea Ax = 0. En notación de conjuntos, 

Nul A = {x : x está en IR" y Ax = 0} 


Una descripción más dinámica de Nul A es el conjunto de todas las x en IR" que se ma- 
pean en el vector cero de R m a través de la transformación lineal x Ax. Véase la figura 1. 



FIGURA 1 


EJEMPLO 1 


Sea A la matriz en la ecuación (2) anterior, y sea u = 



. Determine 


si u pertenece al espacio nulo de A. 


SOLUCIÓN Para probar si u satisface Au = 0, simplemente se calcula 


1-3-2' 

5' 

72 


5- 9 + 4' 


'0' 

-5 9 1_ 

D 

-2 


-25 + 27 -2 


0 


Por lo tanto, u está en Nul A. 


El término espacio en el espacio mdo es adecuado ya que el espacio nulo de una matriz 
es un espacio vectorial, como se muestra en el siguiente teorema. 


El espacio nulo de una matriz A de m x n es un subespacio de IR". De manera equiva¬ 
lente, el conjunto de todas las soluciones a un sistema Ax = 0 de m ecuaciones lineales 
homogéneas con n incógnitas es un subespacio de IR". 
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DEMOSTRACIÓN Sin duda, Nul A es un subconjunto de R" porque A tiene n columnas. 
Debemos demostrar que Nul A satisface las tres propiedades de un subespacio. Desde luego, 
0 está en Nul A. Ahora, considere que u y v representan los dos vectores de Nul A. De esta 
forma, 


Au = 0 y Av = 0 

Para demostrar que u + v está en Nul A, se tiene que demostrar que A(u + v) = 0. Utilizando 
una propiedad de multiplicación de matrices, calcule 

A(u + v) = Au + Av = 0 + 0 = 0 

Por lo tanto, u + v está en Nul A, y Nul A es cerrado bajo la suma de vectores. Por último, 
si c es un escalar cualquiera, entonces 

A(cu) = c(Au) = c(0) = 0, 

lo que demuestra que cu está en Nul A. Así, Nul A es un subespacio de R". ■ 

EJEMPLO 2 Sea H el conjunto de los vectores en R 4 cuyas coordenadas a, b, c, d sa¬ 
tisfacen las ecuaciones a — 2b + 5c = d, y c — a = b. Demuestre que H es un subespacio 
de R 4 . 

SOLUCIÓN Al reordenar las ecuaciones que describen los elementos de H, y al observar 
que H es el conjunto de todas las soluciones del siguiente sistema de ecuaciones lineales 
homogéneas: 

a — 2b + 5c — d = 0 
—a — b + c =0 

De acuerdo con el teorema 2, H es un subespacio de R 4 . ■ 

Es importante hacer notar que las ecuaciones lineales que definen el conjunto H son ho¬ 
mogéneas. De lo contrario, el conjunto de soluciones no será definitivamente un subespacio 
(porque el vector cero no es una solución de un sistema no homogéneo). Además, en algunos 
casos, el conjunto de soluciones podría estar vacío. 


Una descripción explícita de Nul A 

No hay una relación evidente entre los vectores en Nul A y las entradas de A. Se dice que 
Nul A se define de forma implícita, ya que se define por una condición que se debe compro¬ 
bar. No existe una lista o una descripción explícitas de los elementos de Nul A. Sin embargo, 
resolver la ecuación Ax = 0 equivale a hacer una descripción explícita de Nul A. El siguiente 
ejemplo revisa el procedimiento de la sección 1.5. 


EJEMPLO 3 Determine un conjunto generador del espacio nulo de la matriz 


A = 



6 

-2 

-4 


-1 

2 

5 



SOLUCIÓN El primer paso es encontrar la solución general de Ax = 0 en términos de va¬ 
riables libres. Reduzca por filas la matriz aumentada [A 0] a la forma escalonada reducida 
para escribir las variables básicas en términos de las variables libres: 

"1-2 0-1 3 0 

00 1 2-20 

0 0 0 0 0 0 


X\ — ¿X 2 — X4 + ¿X5 = 0 

X3 + 2X4 — 2 .X 5 = 0 
0 = 0 
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DEFINICIÓN 


TEOREMA 3 


La solución general es x\ = 2 x 2 + X 4 — 3 x 5 , -*3 = — 2 x 4 + 2 x 5 , con X 2 , X 4 y X 5 libres. 
Luego, hay que descomponer el vector que da la solución general en una combinación li¬ 
neal de vectores donde los pesos son las variables libres. Es decir, 


XI 


2X2 + X 4 — 3X5 


~2~ 


r 


~-3~ 

X2 


*2 


1 


0 


0 

*3 

= 

— 2 X 4 + 2 X 5 

= *2 

0 

+ X4 

-2 

+ *5 

2 

X4 


X4 


0 


1 


0 

*5 


*5 


0 


0 


1 


t t t 

U V w 

= X2U + X4V + X5W 


(3) 


Cada combinación lineal de u, v y w es un elemento de Nul A. Por lo tanto, {u, v, w} es un 
conjunto generador para Nul A. ■ 

Hay que hacer notar dos hechos acerca de la solución del ejemplo 3 que se aplican a 
todos los problemas de este tipo, donde Nul A contiene vectores distintos de cero. Vamos 
a considerar estos datos más adelante. 

1. El conjunto generador producido por el método del ejemplo 3 es linealmente indepen¬ 
diente de manera automática debido a que las variables libres son los pesos de los vectores 
generados. Por ejemplo, vea la segunda, cuarta y quinta entradas en el vector solución en 
la ecuación (3) y observe que X2U + X4V + X5W puede ser 0 solo si los pesos X2, X4 y X5 son 
todos cero. 

2. Cuando Nul A contiene vectores distintos de cero, el número de vectores en el conjunto 
generador para Nul A es igual al número de variables libres en la ecuación Ax = 0. 


El espacio columna de una matriz 

Otro subespacio importante asociado con una matriz es el espacio columna. A diferencia 
del espacio nulo, el espacio columna se define de forma explícita a través de combinaciones 
lineales. 


El espacio columna de una matriz A de m x n, que se denota como Col A, es el conjunto 
de todas las combinaciones lineales de las columnas de A. Si A = [a¡ ••• a„], entonces 

Col A = Gen {ai,..., a,,} 


Ya que Gen {ai,..., a,,} es un subespacio, de acuerdo con el teorema 1, el siguiente teore¬ 
ma se deduce de la definición de Col A y del hecho de que las columnas de A están en R"'. 


El espacio columna de una matriz A de m x n es un subespacio de R'". 


Observe que un vector típico de Col A se puede escribir como Ax para alguna x, ya que la 
notación Ax representa una combinación lineal de las columnas de A. Es decir, 


Col A = { b : b = Ax para alguna x en R" ¡ 


La notación Ax para los vectores en Col A también muestra que A es el rango de la transfor¬ 
mación lineal x >-> Ax. Regresaremos a este punto de vista al final de la sección. 
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EJEMPLO 4 Encuentre una matriz A tal que W = Col A. 


W = 


1 6 a — b 
a + b 
-la 


: a, b en I 


SOLUCIÓN En primer lugar, escriba W como un conjunto de combinaciones lineales. 


í 

6~ 


’-r 

) f 

6 


_ -r 

) 

W = la 

1 

+ b 

i 

: a, b en R > = Gen < 

1 


i 

{ 

1 

-7 


0 

í l 

-7 


0 

1 


En segundo lugar, utilice los vectores en el conjunto generador como las columnas de A. 


Sea A 


6 -1 
1 1 
-7 0 


. De esta forma, W = Col A , como se desea. 


Recuerde el teorema 4 de la sección 1.4, según el cual las columnas de A generan a R'” 
si y solo si la ecuación Ax = b tiene una solución para cada b. Podemos enunciar este hecho 
con palabras de la siguiente manera: 


El espacio columna de una matriz A de m x n es R m si y solo si la ecuación Ax = b tiene 
una solución para cada b en R'". 


Contraste entre Nul A y Col A 

Es natural preguntarse cómo se relacionan el espacio nulo y el espacio columna de una matriz. 
De hecho, los dos espacios son muy diferentes, como se constata en los ejemplos 5 a 7. Sin 
embargo, una sorprendente conexión entre el espacio nulo y el espacio columna se verá en la 
sección 4.6, cuando hayamos estudiado más teoría. 


EJEMPLO 5 Sea 



1 

3 

6 


a) Si el espacio columna de A es un subespacio de R\ ¿a qué es igual kl 

b) Si el espacio nulo de A es un subespacio de R ,; , ¿a qué es igual kl 

SOLUCIÓN 

a) Cada una de las columnas de A tiene tres entradas, por lo que Col A es un subespacio 
de U k , donde k = 3. 

b) Un vector x tal que Ax esté definido debe tener cuatro entradas, por lo que Nul A es un 

subespacio de R A , donde k = 4. ■ 

Cuando una matriz no es cuadrada, como en el ejemplo 5, los vectores en Nul A y 
Col A viven en “universos” totalmente diferentes. Por ejemplo, ninguna combinación li¬ 
neal de vectores en R 3 puede producir un vector en R 4 . Cuando A es cuadrada, Nul A y 
Col A tienen el vector cero en común, y en casos especiales es posible que algunos vectores 
diferentes de cero pertenezcan tanto a Nul A como a Col A. 
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EJEMPLO 6 Con A como en el ejemplo 5, encuentre un vector diferente de cero en Col 
A y otro en Nul A. 

SOLUCION Es fácil encontrar un vector en Col A. Cualquier columna de A lo permite, 


por ejemplo, 


2 

-2 

3 


. Para encontrar un vector distinto de cero en Nul A, al reducir por filas 


la matriz aumentada [A 0] se obtiene 


[A 0] 


1 0 9 0 0 
01-500 
0 0 0 1 0 


Por lo tanto, si x satisface Ax = 0, entonces x¡ = — 9 ^ 3 , x 2 = 5 x 3 , M = 0, y X 3 es libre. 
Al asignar un valor distinto de cero para X3, por ejemplo, X3 = 1, se obtiene un vector de 
Nul A, a saber, x = (—9, 5, 1, 0). ■ 



3" 



EJ EM PLO 7 Con A como en el ejemplo 5, sean u = 

-2 

-1 

y v — 

3 

-1 

3 


0 




a) Determine si u está en Nul A. ¿Podría u estar en Col A? 
tí) Determine si v está en Col A. ¿Podría v estar en Nul A? 

SOLUCIÓN 

d) Una descripción explícita de Nul A no es necesaria aquí. Basta con calcular el pro¬ 
ducto Au. 


Au = 


2 4 
-2 -5 

3 7 


-2 

7 

-8 



3 


0 


"0" 


— A 

-1 

0 

= 

-3 


0 

- 


3 


0 


Evidentemente, u no es una solución de Ax = 0, por lo que u no está en Nul A. Además, 
con cuatro entradas, u no podría estar en Col A, ya que Col A es un subespacio de R :5 . 
tí) Se reduce [A v] a una forma escalonada. 


2 

4 

-2 

1 

3 


2 

4 

-2 

1 

3" 

-2 

-5 

7 

3 

-1 


0 

1 

-5 

-4 

-2 

3 

7 

-8 

6 

3 


0 

0 

0 

17 

1 


En este punto, es claro que la ecuación Ax = v es consistente, por lo que v está en 
Col A. Con solo tres entradas, v no podría estar en Nul A, ya que Nul A es un subespacio 
de IR 4 . ■ 

La tabla de la página 204 resume lo que hemos aprendido acerca de Nul A y Col A. 
El punto 8 es una nueva formulación de los teoremas 11 y 12a) de la sección 1.9. 


Núcleo y rango de una transformación lineal 

Otros subespacios de espacios vectoriales diferentes de R" con frecuencia se describen en 
términos de una transformación lineal y no de una matriz. Con la finalidad de precisar esto, 
generalizamos la definición que dimos en la sección 1.8. 
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CAPITULO 4 


Espacios vectoriales 


DEFINICIÓN 


Comparación entre Nul A y Col A para una matriz A de m x n 

Nul A Col A 


1. Nul A es un subespacio de IR". 

2. Nul A se define implícitamente, es decir, solo 
estableciendo una condición (Ax = 0) que los 
vectores de Nul A deben satisfacer. 

3. Se necesita tiempo para encontrar vectores de 
Nul A. Se requiere efectuar operaciones de fila 
en [A 0], 

4. No hay una relación evidente entre Nul A y las 4. 
entradas de A. 

5. Un vector típico v de Nul A tiene la propiedad 5. 
de que Av = 0. 

6 . Dado un vector específico v, es fácil saber si v 6. 
está en Nul A. Solo hay que calcular Av. 

7. Nul A = { 0 } si y solo si la ecuación Ax = 0 7. 

tiene solamente la solución trivial. 

8 . Nul A = {0} si y solo si la transformación li- 8 . 
neal x Ax es de uno a uno. 


1. Col A es un subespacio de IR"'. 

2. Col A se define explícitamente, es decir, se in¬ 
dica cómo construir vectores en Col A. 

3. Es fácil encontrar vectores en Col A. Las co¬ 
lumnas de A se muestran, y las otras se forman 
a partir de ellas. 

Existe una relación evidente entre Col A y las 
entradas de A, ya que cada columna de A está 
en Col A. 

Un vector típico v en Col A tiene la propiedad 
de que la ecuación Ax = v es consistente. 
Dado un vector específico v, puede tomar al¬ 
gún tiempo saber si v está en Col A. Se requie¬ 
ren operaciones de fila en [A v]. 

Col A = IR'" si y solo si la ecuación Ax = b 
tiene una solución para toda b en IR"'. 

Col A = IR"' si y solo si la transformación li¬ 
neal x i-» Ax mapea IR" sobre IR”'. 


Una transformación lineal T de un espacio vectorial V en un espacio vectorial W 
es una regla que asigna a cada vector x en V un único vector 7Yx) en W, tal que 

i. 7Yu + v) = 7Yu ) + T(v) para toda u, v en V, y 

ii. T(cu) = cT(u) para toda u en V y todo escalar c. 


El núcleo (o espacio nulo) de dicha T es el conjunto de todas las u en V tales que 
T(u) = 0 (el vector cero en W). El rango de T es el conjunto de todos los vectores en W 
de la forma T(x) para alguna x en V. Si ocurre que T surge como una transformación matri- 
cial, por ejemplo, 7Yx) = Ax para alguna matriz A, entonces el núcleo y la imagen de T son 
solo el espacio nulo y el espacio columna de A, como se definió anteriormente. 

No es difícil demostrar que el núcleo de T es un subespacio de V. La demostración es, 
en esencia, la misma que para el teorema 2. Además, el rango de T es un subespacio de W. 
Véase la figura 2 y el ejercicio 30. 






El núcleo es un 
subespacio de V 


El rango es un N 
subespacio de W ' 



FIGURA 2 Subespacios asociados con 
una transformación lineal. 


En aplicaciones, un subespacio suele surgir ya sea como el núcleo, o bien, como el ran¬ 
go de una transformación lineal adecuada. Por ejemplo, el conjunto de todas las soluciones 
de una ecuación diferencial lineal homogénea resulta ser el núcleo de una transformación 
lineal. 
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En general, una transformación lineal de este tipo se describe en términos de una o más deri¬ 
vadas de una función. Explicar esto en detalle nos llevaría demasiado lejos en este momento, 
por lo que consideramos solo dos ejemplos. El primero explica por qué la operación de dife¬ 
renciación es una transformación lineal. 

EJEMPLO 8 (Requiere conocimientos de cálculo) Sea V el espacio vectorial de todas 
las funciones de valores reales / definidas en un intervalo [a, b] con la propiedad de que 
son diferenciables, y sus derivadas son funciones continuas en [a, b]. Sea W el espacio vec¬ 
torial C[a, b ] de todas las funciones continuas en [a, /;], y sea D : V —> W la transfor¬ 
mación que cambia a/en V en su derivada /'. En cálculo, dos reglas sencillas de la diferen¬ 
ciación son 


D(f + g) = D{f) + D(g) y D(cf) = cD(f) 

Es decir, D es una transformación lineal. Es posible demostrar que el núcleo de D es el 
conjunto de las funciones constantes en [a, b] y el rango de D es el conjunto W de todas 
las funciones continuas en | a, b\. ■ 

EJEMPLO 9 (Requiere conocimientos de cálculo) La ecuación diferencial 

y" + co 2 y = 0, (4) 

donde oj es una constante, se utiliza para describir una variedad de sistemas físicos, tales 
como la vibración de un resorte del que pende un peso, el movimiento de un péndulo, y el 
voltaje en un circuito eléctrico de inductancia-capacitancia. El conjunto de soluciones de (4) 
es precisamente el núcleo de la transformación lineal que mapea una función y = f(t) en la 
función de f"(t) + orfit). Encontrar una descripción explícita de este espacio vectorial es 
un problema de ecuaciones diferenciales. El conjunto solución resulta ser el espacio descrito 
en el ejercicio 19 de la sección 4.1. ■ 


PROBLEMAS DE PRÁCTICA 

: a — 3b — c = ol. Demuestre de dos maneras diferentes que W es 


un subespacio de R 3 . (Utilice dos teoremas). 



“7-3 5 


2 


7 


2. Sea A = 

-4 1 -5 

-5 2 -4 

, v = 

1 

-1 

y w = 

6 

-3 

. Suponga que sabe que las 


ecuaciones Ax = v y Ax = w son consistentes. ¿Qué puede decir acerca de la ecuación 
Ax = v + w? 


1. Sea W = 


4.2 EJERCICIOS 



1 " 



1 _ 


1. Determine si w = 

3 

está en Nul A, donde 

2. Determine si w = 

-1 

está en Nul A, donde 


-4 



1 




L 

_l 

L_ 


3 -5 -3" 


2 6 4~ 

A = 

6-2 0 

A = 

-3 2 5 


-8 4 1 


-5 -4 1 
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En los ejercicios 3 a 6, encuentre una descripción explícita de Nul A, 
haciendo una lista de vectores que generan el espacio nulo. 


21. Con A como en el ejercicio 17, encuentre un vector distinto de 
cero en Nul A y otro en Col A. 


3. 

A = 

' 1 
_0 

2 

1 

4 

3 

1 1 

O <N 

1 


22. 

4. 

A = 

' 1 

0 

-3 

0 

2 

3 

0 ' 

0 


23. 



' 1 

-4 

0 

2 

0~ 


5. 

A = 

0 

0 

1 

-5 

0 




0 

0 

0 

0 

2 

24. 



' 1 

3 

—4 

-3 

1 ' 


6. 

A = 

0 

1 

-3 

1 

0 




0 

0 

0 

0 

0 



de cero en Nul A y otro en Col A. 


23. Sea A = 


y w = 


Col A. ¿Está w en Nul A? 


24. Sea A = 


está en Col A. ¿Está w en Nul A? 


' 10 

-8 

-2 

-2~ 


~2~ 

0 

2 

2 

—2 


2 

1 

-1 

6 

0 

y w = 

0 

1 

1 

0 

-2 


2 


. Determine si w está en 


. Determine si w 


En los ejercicios 7 a 14, utilice un teorema adecuado para demostrar 
que el conjunto dado, W, es un espacio vectorial, o bien, encuentre un 
ejemplo específico de lo contrario. 


f 

a 

) f 

r 

\ 

7 ‘ 

b 

\ o. b c — 2 > 8. \ 

s 

: 3r — 2 = 3j 4- 1 > 

1 

c 

J l 

t 

1 


P~ 




a 

' 

q 

p — 3q = 4s 

10 . 


b 

3a + b = c 
: , 

r 

' 2p = s + 5r 



c 

a + b + 2c = 2d 

s 




d 



s — 2t 

' 


í 

3 p — 5q 


3 4- 3 s 
3s 4- 1 

: i, t reales 

12. 

1 

4 q 

P 

: p, q reales 

2 s 




q -\- \ 

. 

c — 6d 


I I 

í 

— s + 3 1 

] 

d 

: c, d reales 

W. 

1 

s — 2t 

: s, 1 reales > 

c 


J 

i 

5s — t 

J 


En los ejercicios 15 y 16, encuentre A tal que el conjunto dado 
sea Col A. 


15. 


2 s t 

r — s + 2t 

3 r + í 

2 r — s — t 


r, s, t reales 


16. 



b — c 

‘ 


2b 4- 3 d 
b + 3c — 3d 

: b, c, d reales 


c + d 



Para las matrices de los ejercicios 17 a 20, a) encuentre k tal que 
Nul A sea un subespacio de [R^, y b) encuentre k tal que Col A sea 
un subespacio de R*. 


6 -41 


'5-2 3' 

3 

2 

18. A = 

-1 0 -1 

9 

6 

0 -2 -2 

9 -6 J 


-5 7 2 


19. 



5 -2 

1 0 


6 0 
1 0 


En los ejercicios 25 y 26, A denota una matriz de m x n. Marque cada 
enunciado como verdadero o falso. Justifique sus respuestas. 

25. a) El espacio nulo de A es el conjunto solución de la ecuación 

Ax = 0. 

b) El espacio nulo de una matriz de m x n está en R" ! . 

c) El espacio columna de A es el rango del rnapeo x >-» Ax. 

d) Si la ecuación Ax = b es consistente, entonces Col A es R m . 

e) El núcleo de una transformación lineal es un espacio 
vectorial. 

f) Col A es el conjunto de todos los vectores que se pueden 
escribir como Ax para alguna x. 

26. a) Un espacio nulo es un espacio vectorial. 

b) El espacio columna de una matriz de m x n está en R m . 

c) Col A es el conjunto de todas las soluciones de Ax = b. 

d) Nul A es el núcleo del mapeo x i-> Ax. 

e) El rango de una transformación lineal es un espacio 
vectorial. 

f) El conjunto de todas las soluciones de una ecuación dife¬ 
rencial lineal homogénea es el núcleo de una transformación 
lineal. 

27. Es posible demostrar que una solución del sistema que se mues¬ 
tra a continuación es x¡ = 3, X 2 — 2, y x-¡ = — 1. Con base en 
este hecho y en la teoría de esta sección, explique por qué otra 
solución es x\ = 30, X 2 — 20, y X 3 = —10. (Observe cómo están 
relacionadas las soluciones, pero no realice otros cálculos). 

X\ — 3x2 — 3X3 = 0 

— 2 xi + 4 x 2 + 2 x 3 = 0 
—XI + 5x2 + 7X3 = 0 

28. Considere los siguientes dos sistemas de ecuaciones: 

5xi + x 2 — 3x 3 = 0 5xi + x 2 — 3x 3 = 0 

—9xi + 2 x 2 + 5x 3 = 1 —9xi + 2 x 2 + 5x 3 = 5 

4x'i + x 2 — 6 x 3 = 9 4xi 4- x 2 — 6 x 3 = 45 

Es posible demostrar que el primer sistema tiene una solución. 

Con base en este hecho y en la teoría de esta sección, explique 
por qué el segundo sistema también debe tener una solución. 
(No realice operaciones de fila). 


20. A = [1 -3 2 0 -5] 
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29. Demuestre el teorema 3 de la siguiente manera: dada una matriz 
A de m xn,un elemento de Col A tiene la forma Ax para alguna 
x en IR". Sean Ax y Aw dos vectores cualesquiera en Col A. 

a) Explique por qué el vector cero está en Col A. 


35. Sean V y W espacios vectoriales, y sea T : V —> W una trans¬ 
formación lineal. Dado un subespacio U de V, sea T(U) el 
conjunto de todas las imágenes de la forma T(x), donde x está 
en U. Demuestre que T(U) es un subespacio de W. 


tí) Demuestre que el vector Ax + Aw está en Col A. 
c) Dado un escalar c, demuestre que c(Ax) está en Col A. 

30. Sea T: V—>■ W una transformación lineal de un espacio vectorial 
V en un espacio vectorial W. Demuestre que el rango de T es 
un subespacio de W. [Sugerencia: Considere que los elementos 
típicos del rango tienen la forma T(x) y T( w) para alguna x, w 
en V], 


31. Defina T : P> 2 


R 2 mediante T(p) = 


P(0) 

P(l) 


. Por ejemplo. 


36. Dada T : V —> W como en el ejercicio 35, y dado un subespa¬ 
cio Z de W, sea U el conjunto de todas las x en V tales que T(x) 
está en Z. Demuestre que U es un subespacio de V. 

37. [M] Determine si w está en el espacio columna de A, en el espa¬ 
cio nulo de A, o en ambos, donde. 



1 ■ 


7 

6 

-4 

1 ' 


1 


-5 

-1 

0 

-2 

w = 

-1 

, A = 

9 

-11 

7 

-3 


-3 


19 

-9 

7 

1 


32. 


33. 


34. 


si p(f) = 3 + 5t + 7t 2 , entonces T (p) = 


3 

15 


38. [M] Determine si w está en el espacio columna de A, en el es¬ 
pacio nulo de A, o en ambos, donde, 


a) Demuestre que T es una transformación lineal. [Sugerencia: 
Para polinomios arbitrarios p, q en P 2 , calcule Tfp + q) 
y T(cp)\. 

tí) Encuentre un polinomio p en P 2 que genere el núcleo de T 
y describa el rango de T. 

Defina una transformación lineal T : P 2 —> R 2 mediante 


' 1 ~ 


'-8 

5 

-2 

0 ' 

2 

, A = 

-5 

2 

1 

-2 

1 


10 

-8 

6 

-3 

0 


3 

-2 

1 

0 


39. [M] Considere que ai,..., as denotan las columnas de la ma¬ 
triz A, donde 


T( P) = 


P(0) 

p(0) 


. Determine los polinomios pi y p 2 en P 2 que 


generan el núcleo de T, y describa el rango de T. 


Sea M 2x2 el espacio vectorial de todas las matrices de 2 x 2, y 
defina T: M 2x2 —» M 2x2 mediante T(A) — A + A T , donde 



a) Demuestre que T es una transformación lineal. 


5 12 2 0 

3 3 2 -1 -12 

8 4 4 -5 12 

21 10-2 


B = [ a! a 2 a 4 ] 


a) Explique por qué a 3 y as están en el espacio columna de B. 

b) Encuentre un conjunto de vectores que genere a Nul A. 

c) Sea T : R 5 —» R 4 definida por T(x) = Ax. Explique por qué 
T no es uno a uno ni sobre. 


b) Sea B cualquier elemento de M 2x2 tal que B T = B. Determine 
una A en Aí 2x2 tal que T(A) = B. 

c) Demuestre que el rango de T es el conjunto de B en M 2x2 con 
la propiedad de que B J = B. 

d) Describa el núcleo de T. 

(Se requiere cálculo) Defina a T : C[0, 1] — > C[0, 1] como 
sigue: Para f en C[0, 1], sea T(f) la antiderivada F de f tal 
que F(0) = 0. Demuestre que T es una transformación lineal, 
y describa el núcleo de T. (Véase la notación en el ejercicio 20 
de la sección 4.1). 


40. [M] Sea H = Gen {vi, v 2 } y K = Gen {V3, V4}, donde 



'5 


' 1 ~ 


2 “ 


0 ' 

Vi = 

3 

.v 2 = 

3 

.v 3 = 

-1 

. v 4 = 

-12 


8 


4 


5 


-28 


Entonces, H y K son subespacios de R 3 . De hecho, H y K son 
planos en R 3 que pasan por el origen, y que se cruzan en una 
recta que pasa por 0. Encuentre un vector w distinto de cero que 
genere esa recta. [Sugerencia: w se puede escribir como civi + 
c 2 v 2 y también como C3V3 + C4V4. Para construir w, resuelva la 
ecuación ciVi + c 2 v 2 = C3V3 + C4V4 para las incógnitas c ; ]. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Primer método: W es un subespacio de IR 3 de acuerdo con el teorema 2, ya que W es 
el conjunto de todas las soluciones de un sistema de ecuaciones lineales homogéneas 
(donde el sistema solamente tiene una ecuación). De manera equivalente, W es el es¬ 
pacio nulo de la matriz de 1 x 3, A = [1 —3 —1]. 
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Segundo método: Resuelva la ecuación a - 3b - c = 0 para la variable principal a en tér- 

f 3b + c 1 


minos de las variables libres b y c. Cualquier solución tiene la forma 


, donde 


by c son arbitrarias, y 


c 


3 b + c 


"3 


r 

b 

= b 

1 

+ c 

0 

c 


0 


1 


t t 


Vi v 2 


Este cálculo muestra que W = Gen {vi, V 2 ¡. Por lo tanto, W es un subespacio de R 3 
de acuerdo con el teorema 1. También se podría despejar b o c de la ecuación a — 3 b — 
c = 0 y obtener descripciones alternativas de W como un conjunto de combinaciones 
lineales de dos vectores. 

2. Tanto v como w están en Col A. Ya que Col A es un espacio vectorial, v + w debe estar 
en Col A. Es decir, la ecuación Ax = v + w es consistente. 


4.3 CONJUNTOS LINEALMENTE INDEPENDIENTES; BASES 


En esta sección identificaremos y estudiaremos los subgrupos que generan un espacio vec¬ 
torial E o un subespacio H tan “eficientemente” como sea posible. La idea clave es la de 
independencia lineal, definida como en R". 

Se dice que un conjunto indexado de vectores {vi,..., v p } en V es linealmente indepen¬ 
diente si la ecuación vectorial 

CiVi + c 2 v 2 -1-h CpYp = 0 (1) 

tiene solamente la solución trivial, c\ = 0,..., c p = O. 1 

Se dice que el conjunto { vi ,..., \ p } es linealmente dependiente si ( 1 ) tiene una solución no 
trivial, es decir, si hay algunos pesos, c\,...,c p , no todos cero , tales que la ecuación (1) sea váli¬ 
da. En tal caso, la ecuación (1) se llama una relación de dependencia lineal entre vi,..., v ;) . 

Al igual que en R", un conjunto que contiene un único vector v es linealmente indepen¬ 
diente si y solo si v A 0. Además, un conjunto de dos vectores es linealmente dependiente 
si y solo si uno de los vectores es un múltiplo del otro. Y cualquier conjunto que contenga al 
vector cero es linealmente dependiente. El siguiente teorema tiene la misma demostración 
que el teorema 7 de la sección 1.7. 


TEOREMA 4 Un conjunto indexado {vi,..., \ p } de dos o más vectores, con A 0, es linealmente 
dependiente si y solo si alguna v ¡ (con j > 1) es una combinación lineal de los vectores 
anteriores. Vi,..., v ; _ j. 


La principal diferencia entre la dependencia lineal en R" y en un espacio vectorial ge¬ 
neral es que cuando los vectores no son n-adas, la ecuación homogénea (1), por lo general, 
no se puede escribir como un sistema de n ecuaciones lineales. Es decir, los vectores no se 
pueden convertir en las columnas de una matriz A con la finalidad de estudiar la ecuación 
Ax = 0. En vez de ello, debemos utilizar la definición de dependencia lineal y el teorema 4. 

EJEMPLO 1 Sea pj(í) = 1, p 2 (í) = t y p 3 (f) = 4 — t. Entonces, { p 3 , p 2 , p 3 } es lineal¬ 
mente dependiente en P debido a p 3 = 4p! — p 2 . ■ 


1 Es conveniente utilizar ci,..., c p en la ecuación (1) para los escalares en vez de Xi,..., x p , como lo hicimos en el 
capítulo 1. 
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EJEMPLO 2 El conjunto {sen t, eos t} es linealmente independiente en C[0, 1], el espa¬ 
cio de todas las funciones continuas en 0 < t < 1 , porque sen t y eos t no son múltiplos entre 
sí como vectores en C[0, 1], Es decir, no hay escalar c tal que eos t = c • sen t para toda t en 
[0, 1]. (Véase las gráficas de sen t y eos i). Sin embargo, {sen 1 eos t, sen 2t] es linealmente 
dependiente debido a la identidad: sen 2t = 2 sen t eos t, para toda t. ■ 


DEFINICION Sea H un subespacio de un espacio vectorial V. Un conjunto indexado de vectores 
B = {bi . bp) en V es una base de H si 

i. B es un conjunto linealmente independiente, y 

ii. el subespacio generado por B coincide con H, es decir, 

H = Gen { bi,..b /; ¡ 


La definición de una base se aplica al caso en que H = V, ya que cualquier espacio 
vectorial es un subespacio de sí mismo. Así, una base de V es un conjunto linealmente inde¬ 
pendiente que genera a V. Observe que cuando H A V, la condición ii incluye el requisito 
de que cada uno de los vectores bi,..., b ; , debe pertenecer a //, porque Gen {bj,..., b ;; { con¬ 
tiene a bi,..., b p , como se muestra en la sección 4.1. 

EJEMPLO 3 Sea A una matriz invertible de n x n. por ejemplo, A = {ai — a„] . Entonces, 
las columnas de A forman una base para IR", ya que son linealmente independientes y gene¬ 
ran a R", por el teorema de la matriz invertible. ■ 


EJEMPLO 4 Sean ei ,..., e,„ las columnas de la matriz identidad /„ de n x n. Es decir. 


ei 


1 


"0 


0 

0 


1 




, e 2 = 


5 • • • > &tl - 

0 

_ 0 _ 


_ 0 _ 


1 



FIGURA 1 

La base estándar para R 3 . 


El conjunto { ei,..., e,,} se llama la base estándar para R" (figura 1). 


EJEMPLOS Sean vi = 

3 

0 

, y 2 = 

~ —4~ 
1 

y v 3 = 

~-2~ 

1 


-6 


7 


5 


. Determine si {vi, V 2 , V 3 } 


es una base para R 3 . 


SOLUCIÓN Puesto que hay exactamente tres vectores aquí en R 3 , se puede utilizar cual¬ 
quiera de los diversos métodos para determinar si la matriz A = [vi V 2 V 3 ] es invertible. Por 
ejemplo, dos remplazos de fila revelan que A tiene tres posiciones pivote. Por lo tanto, A es 
invertible. Como en el ejemplo 3, las columnas de A forman una base para R 3 . ■ 


EJEMPLO 6 Sea S = {1, t, t 2 ,..., t n }. Compruebe que S es una base para P„. Esta base 
se llama la base estándar para P„. 

SOLUCIÓN Sin duda, S genera a P„. Para demostrar que S es linealmente independiente, 
suponga que co,..., c„ satisfacen 

Co ' 1 + C\t + C 2 Í~ + • • • + c n t n = 0(f) (2) 

Esta igualdad significa que el polinomio de la izquierda tiene los mismos valores que el 
polinomio cero de la derecha. Un teorema fundamental del álgebra dice que el único polinomio 
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y = t 


y = i 


FIGURA 2 

La base estándar para P2- 



i 


TEOREMA 5 


en P,„ con más de n ceros es el polinomio cero. Es decir, la ecuación (2) se cumple para to¬ 
das las t solo si Co = •" = c n = 0. Esto demuestra que S es linealmente independiente y, 
por lo tanto, es una base para P n . Véase la figura 2. ■ 

Problemas relacionados con la independencia lineal y la generación en P„ se manejan 
mejor con una técnica que se analizará en la sección 4.4. 

El teorema del conjunto generador 

Como se verá, una base es un “eficiente” conjunto generador que no contiene vectores inne¬ 
cesarios. De hecho, una base se construye a partir de un conjunto generador descartando los 
vectores innecesarios. 

EJEMPLO 7 Sean 


0 

2 

. v 2 = 

~2~ 

2 

, v 3 = 

6 

16 

y H = Gen {vi, V2, V3} 

-1 


0 


-5 



Considere que V 3 = 5vi + 3 v 2 , y demuestre que Gen {vi, V 2 , V 3 } = Gen {vi, V 2 }- Luego, 
encuentre una base para el subespacio H. 

SOLUCIÓN Cada vector en Gen {vi, V 2 ! pertenece a H porque 

C1V1 + C2V2 = C1V1 + C 2 X 2 + 0v 3 

Ahora sea x cualquier vector en H, por ejemplo, x = cqvi + C 2 V 2 + C 3 V 3 . Puesto que 
V 3 = 5vi + 3 v 2 , podemos sustituir 

x = ciVi + c 2 x 2 + c 3 (5vi + 3v 2 ) 

= (ci + 5 c 3 )vi + (c 2 + 3c 3 )v 2 

Así, x está en Gen {vi, V 2 }, por lo que cada vector en H ya pertenece a Gen {vi, V 2 }. Llega¬ 
mos a la conclusión de que H y Gen {Vi, V 2 } en realidad son el mismo conjunto de vectores. 
De lo que se deduce que {vi, V 2 } es una base de //, ya que ¡Vi, V 2 } es, sin duda, linealmente 
independiente. ■ 

El siguiente teorema generaliza el ejemplo 7. 

El teorema del conjunto generador 

Sea S = {vi,..., Vp) un conjunto en V, y sea H = Gen {vi,..., Vp}. 

a) Si uno de los vectores de S , por ejemplo v*, es una combinación lineal de los 
vectores restantes en S, entonces el conjunto formado a partir de S al eliminar v* 
aún genera a H. 

b) Si H A ¡ 0 }, algún subconjunto de S es una base para H. 


DEMOSTRACIÓN 

a) Al reordenar la lista de vectores en S, si es necesario, podemos suponer que v ; , es una 
combinación lineal de Vi,..., v p _i, por ejemplo, 

x p = a 1 V 1 -I-h Gp-iVp-i (3) 

Dada cualquier x en H, podemos escribir 

X = C1V1 -I-b Cp_iVp-i + CpVp (4) 

para escalares adecuados Ci,..., c p . Sustituyendo la expresión para \ p de la ecuación 
(3) en (4), es fácil ver que x es una combinación lineal de Vi,..., x p -\. Por lo tanto, 
{Vi,..., x p - 1 } genera a H, ya que x es un elemento arbitrario de //. 




4.3 Conjuntos linealmente independientes; bases 211 


b ) Si el conjunto generador original S es linealmente independiente, entonces ya es una base 
para H. De lo contrario, uno de los vectores de S depende de los demás y se puede elimi¬ 
nar, de acuerdo con el inciso a). Siempre y cuando haya dos o más vectores en el conjunto 
generado, podemos repetir el proceso hasta que el conjunto generador sea linealmente 
independiente y, por lo tanto, sea una base para H. Si el conjunto generador finalmente se 
reduce a un vector, ese vector será distinto de cero (y, por lo tanto, linealmente indepen¬ 
diente), ya que H A {0}. ■ 


Bases para Nul A y Col A 

Ya sabemos cómo encontrar los vectores que generan el espacio nulo de una matriz A. El 
análisis de la sección 4.2 indicó que nuestro método siempre produce un conjunto linealmente 
independiente cuando Nul A contiene vectores distintos de cero. Por lo tanto, en este caso, 
ese método produce una base para Nul A. 

Los dos ejemplos siguientes describen un sencillo algoritmo que permite encontrar una 
base para el espacio columna. 


EJEMPLO 8 Encuentre una base para Col B, donde 


B = [ b] b 2 




1 4 0 2 0 
001-10 
0 0 0 0 1 
0 0 0 0 0 


SOLUCIÓN Cada columna que no es pivote de B es una combinación lineal de las columnas 
pivote. De hecho, b 2 = 4b¡ y b 4 = 2b! — b 3 . De acuerdo con el teorema del conjunto genera¬ 
dor, podemos descartar a b 2 y b 4 , y {bi, b 3 , b 3 ¡ aún generará a Col B. Sea 


5 


{bi,b 3 .b 5 } 



■ 1' 


"o" 


'0' 

' 


0 


1 


0 



0 

’ 

0 

’ 

1 


. 

0 


0 


0 



Ya que bi =f= 0 y ningún vector en S es una combinación lineal de los vectores que lo preceden, 
S es linealmente independiente (teorema 4). Por lo tanto, S es una base de Col B. ■ 


¿Qué pasa con una matriz A que no está en forma escalonada reducida? Recuerde que 
toda relación de dependencia lineal entre las columnas de A se puede expresar en la forma 
Ax = 0, donde x es una columna de pesos. (Si algunas columnas no están implicadas en una 
relación de dependencia en particular, entonces sus pesos son iguales a cero). Cuando A se 
reduce por filas a una matriz B, las columnas de B con frecuencia son totalmente diferentes 
de las columnas de A. Sin embargo, las ecuaciones Ax = 0 y Bx = 0 tienen exactamente el 
mismo conjunto de soluciones. Si A = |ai a„] y B = |b¡ ••• b„], entonces las ecuacio¬ 
nes vectoriales 

xiai -I- 1 - x n a„ = 0 y xibi -I-h x n b„ = 0 


también tienen el mismo conjunto de soluciones. Es decir, las columnas de A tienen exacta¬ 
mente la misma relación ele dependencia lineal que las columnas de B. 


EJEMPLO 9 Es posible demostrar que la matriz 


A = [ ai a 2 


as] 


1 4 0 2 -1 

3 12 1 5 5 

2 8 13 2 

5 20 2 8 8 


es equivalente por filas a la matriz B del ejemplo 8 . Encuentre una base para Col A. 



212 


CAPITULO 4 


Espacios vectoriales 


SOLUCIÓN En el ejemplo 8 vimos que 

b 2 = 4b i y b 4 = 2b i — b 3 
por lo que podemos esperar que 

a 2 = 4a i y a 4 = 2ai — a 3 

¡Compruebe que este es el caso! Por lo tanto, podemos descartar a a 2 y a 4 cuando seleccio¬ 
namos un conjunto generador mínimo de Col A. En efecto, {ai, a 3 , as} debe ser linealmente 
independiente porque cualquier relación de dependencia lineal entre ai, a 3 , as implicaría una 
relación de dependencia lineal entre bi, b 3 , bs. Pero sabemos que {bi, b 3 , bs } es un conjunto 
linealmente independiente. Por lo tanto, { ai, a 3 , as } es una base para Col A. Las columnas que 
se han utilizado para esta base son las columnas pivote de A. ■ 

Los ejemplos 8 y 9 ilustran el siguiente hecho que resulta de utilidad. 


TEOREMA 6 


Las columnas pivote de una matriz A forman una base para Col A. 


DEMOSTRACIÓN La demostración general utiliza los argumentos analizados antes. Sea 
B la forma escalonada reducida de A. El conjunto de columnas pivote de B es linealmente 
independiente, pues ningún vector del conjunto es una combinación lineal de los vectores 
que le preceden. Puesto que A es equivalente por filas, también las columnas pivote de A son 
linealmente independientes, ya que cualquier relación de dependencia lineal entre las co¬ 
lumnas de A corresponde a una relación de dependencia lineal entre las columnas de B. Por 
esta misma razón, todas las columnas que no sean pivote de A son una combinación lineal 
de las columnas pivote de A. Así, las columnas de A que no son pivote se pueden descar¬ 
tar del conjunto generador de Col A, de acuerdo con el teorema del conjunto generador. 
Esto deja a las columnas pivote de A como base para Col A. ■ 

Advertencia: Las columnas pivote de un matriz A son evidentes cuando A se ha reducido 
solamente a la forma escalonada. Sin embargo, tenga cuidado al usar las columnas pivote de 
la misma A como la base de Col A. Las operaciones de fila pueden cambiar el espacio colum¬ 
na de una matriz. Las columnas de una forma escalonada B de A con frecuencia no están en 
el espacio columna de A. Por ejemplo, todas las columnas de la matriz B en el ejemplo 8 
tienen ceros en sus últimas entradas, por lo que no pueden generar el espacio columna de la 
matriz A en el ejemplo 9. 


Dos perspectivas de una base 

Cuando se usa el teorema del conjunto generador, la eliminación de los vectores de un con¬ 
junto generador se debe detener cuando el conjunto se convierte en linealmente independiente. 
Si se elimina un vector adicional, no será una combinación lineal de los vectores restantes 
y, por lo tanto, el conjunto más pequeño ya no generará a V. Así, una base es un conjunto 
generador que es lo más pequeño posible. 

Una base también es un conjunto linealmente independiente lo más grande posible. Si S 
es una base para V, y si S se amplía con un vector (por ejemplo, w) de V, entonces el nuevo 
conjunto no puede ser linealmente independiente, ya que S genera a V, y w es, por lo tanto, 
una combinación lineal de los elementos en S. 

EJEMPLO 10 Los siguientes tres conjuntos de R 3 muestran cómo se puede ampliar un 
conjunto linealmente independiente a una base y cómo esta ampliación adicional destruye la 
independencia lineal del conjunto. Además, un conjunto generador se puede reducir a una 
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base, pero una reducción adicional destruye la propiedad de generación. 



Linealmente independiente. Una base 

pero no genera a IR 3 para IR 3 


Genera a IR 3 , pero es 
linealmente dependiente 


PROBLEMAS DE PRACTICA 



r 


~-2~ 

í. Sea vi = 

-2 

3 

y v 2 = 

7 

-9 


. Determine si {vi, V 2 } es una base para R 3 . ¿Es {vi, V 2 } 


una base para R 2 ? 


2 . Sea vi = 

1 ' 
-3 

, v 2 = 

6 

2 

, v 3 = 

2“ 

-2 

y v 4 = 

~- 4 ~ 

-8 


4 


-1 


3 


9 


Determine una base para 


el subespacio W generado por {vi, V2, V3, V4}. 



"l" 


"o" 

í 

S 

) 

3 . Sea Vi = 

0 

, y 2 = 

1 

y h = \ 

s 

: s en R 


0 


0 

l 

_ 0 _ 

1 


jenRj. Entonces cada vector en H es una 


combinación lineal de vi y V2 porque 


s 


T 


"0" 

s 

= 5 

0 

+ s 

1 

_0_ 


0 


0 


¿Es {Vi, V 2 } una base para H1 


4.3 EJERCICIOS 


Determine si los conjuntos de los ejercicios 1 a 8 son bases para IR 3 . 
De los conjuntos que no son bases, determine cuáles son linealmente 
independientes y cuáles generan a IR 3 . Justifique sus respuestas. 



' 1 ■ 


' 1 " 


" 1 ~ 


' 1 _ 


'0 


" 0 " 

1 . 

0 

, 

1 


1 

2 . 

1 


0 


1 


0 


0 


1 


0 


0 


1 



l" 


3" 


'-2" 


2“ 


" 2“ 


'-8' 

3. 

0 

, 

1 

, 

-1 

4. 

-1 

, 

-3 

, 

5 


-3 


-4 


1 


1 


2 


4 



3" 


'-3' 


"0~ 


0 


1 ' 


* —4 ~ 

5. 

-3 

, 

7 

, 

0 


-3 

6. 

2 


3 


0 


0 


0 


5 


-4 


6 


'-2" 


6" 


1 " 


0“ 


2“ 


O - 

3 

, 

-1 

8. 

-2 

, 

3 

, 

-1 

, 

0 

0 


5 


3 


-1 


5 


-1 


Encuentre las bases para los espacios nulos de las matrices en los 
ejercicios 9 y 10. Consulte los comentarios que siguen el ejemplo 3 
en la sección 4.2. 


' 1 

0 

—2 

-2' 


' 1 

1 

—2 

1 

5' 

0 

1 

1 

4 

10 . 

0 

1 

0 

-1 

—2 

3 

-1 

—1 

3 


0 

0 

-8 

0 

16 


11. Encuentre una base para el conjunto de vectores en IR 3 en el 
plano x-3y + 2z = 0. [Sugerencia: Piense en la ecuación como 
en un “sistema” de ecuaciones homogéneas]. 

12. Encuentre una base para el conjunto de vectores de IR 3 en la 
recta y = —3x 

En los ejercicios 13 y 14, suponga que A es equivalente por filas a B. 

Encuentre las bases de Nul A y Col A. 



'-2 

4 

—2 

—4 ~ 


' 1 

0 

6 

5' 

13. A = 

2 

-6 

-3 

1 

, B = 

0 

2 

5 

3 


-3 

8 

2 

-3 


0 

0 

0 

0 


7. 
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14. A = 


B = 


1 

1 

2 

3 

1 

0 

0 

0 


2 3-48 

2 0 2 8 

4 -3 10 9 

6 0 6 9 

2 0 2 5 

0 3-63 

0 0 0 -7 

0 0 0 0 


En los ejercicios 15 a 18. determine una base para el espacio genera¬ 
do por los vectores Vi,.dados. 


1 ' 


' 0 ' 


2 ' 


2 ' 


3' 

0 


1 


-2 


-1 


-1 

-2 

’ 

2 


-8 

’ 

10 

’ 

-6 

3 


3 


0 


3 


9 


' 1 ' 


'- 2 ' 


3' 


5' 


2 ' 

0 


0 


-1 


-3 


-1 

0 

’ 

0 

’ 

1 

* 

3 

’ 

1 

1 


2 


-1 


-4 


0 


17. [M] 


2 “ 


4“ 


"- 2 “ 


8 “ 


'- 8 ' 

0 


0 


-4 


4 


4 

-4 

, 

2 

, 

0 


8 


0 

-6 


-4 


1 


-3 


0 

0 


4 


-7 


15 


1 


18. [M] 


"-3" 


3" 


0 " 


6 “ 


'- 6 ' 

2 


0 


2 


-2 


3 

6 


-9 


-4 


-14 


0 

0 


0 


0 


0 


-1 

-7 


6 


-1 


13 


0 



4 - 


1 " 


7' 

19. Sea Vi = 

-3 

, y 2 = 

9 

, v 3 = 

11 


7 


-2 


6 


, y también sea 


H = Gen [vi, V2, V3}. Es posible comprobar que 4vi + 
5 v 2 — 3 v 3 = 0. Utilice esta información para encontrar una 
base para H. Hay más de una respuesta. 


20 . 


3" 


~4~ 


2 ' 

4 


3 


5 

-2 

, y 2 = 

2 

II 

-6 

-5 


4 


-14 


Es posible 


comprobar que 2 vi — V2 — V3 = 0. Utilice esta información 
para encontrar una base para H — Gen ¡Vi, V2, V3}. 


En los ejercicios 21 y 22, marque cada enunciado como verdadero o 
falso. Justifique sus respuestas. 


21. a) Un solo vector por sí mismo es linealmente dependiente. 

b) Si H = Gen ¡bi,..., b p ], entonces { bi,..., b p ¡ es una base 
para H. 

c) Las columnas de una matriz invertible de n x 11 forman una 
base para IR". 

d) Una base es un conjunto generador que es tan grande como 
sea posible. 

e ) En algunos casos, las relaciones de dependencia lineal entre 
las columnas de una matriz se pueden ver afectadas por al¬ 
gunas operaciones elementales de fila en la matriz. 


22. a) Un conjunto linealmente independiente en un subespacio H 
es una base para H. 

b) Si un conjunto finito S de vectores diferentes de cero genera 
un espacio vectorial V, entonces algún subconjunto de S es 
una base para V. 

c) Una base es un conjunto linealmente independiente que es lo 
más grande posible. 

d) El método estándar para la obtención de un conjunto gene¬ 
rador para Nul A, que se describe en la sección 4.2, a veces 
falla al producir una base para Nul A. 

e) Si B es una forma escalonada de una matriz A, entonces las 
columnas pivote de B forman una base para Col A. 

23. Suponga que IR 4 = Gen ¡Vi,..., V 4 ). Explique por qué {vi,..., V 4 } 
es una base para IR 4 . 

24. Sea B = {vi . v„} un conjunto linealmente independiente 

en IR". Explique por qué B debe ser una base para IR". 



' 1 ' 


"0" 


"0~ 


25. Sea Vi = 

0 

, y 2 = 

1 

, V 3 = 

1 

y sea H el conjunto 


1 


1 


0 



de vectores en IR 3 cuyas segunda y tercera entradas son iguales. 
Entonces, todo vector de H tiene una expansión única como una 
combinación lineal de vi, V2, V3, porque 


s 


' 1 " 


"0" 


"0~ 

t 

t 

= 5 

0 

1 

+ (t ~ s ) 

1 

1 

+ s 

1 

0 


para cualquier s y t. ¿Es ¡vi, V 2 , V 3 ¡ una base para H1 
¿Por qué? 

26. En el espacio vectorial de todas las funciones de valores reales, 
encuentre una base para el subespacio generado por {sen t, sen 
2 1 , sen icos r¡. 

27. Sea V el espacio vectorial de funciones que describen la vibra¬ 
ción de un sistema masa-resorte. (Consulte el ejercicio 19 de la 
sección 4.1). Encuentre una base para V. 

28. (Circuito RLC) El circuito de la figura consiste en una resisten¬ 
cia (R, ohms), un inductor (L, henrys), un condensador (C, fa- 
rads), y una fuente de voltaje inicial. Sea b = R/(2L), y suponga 
que R, L y C se han seleccionado de manera que b también es 
igual a 1 /\JLC. (Esto se hace, por ejemplo, cuando el circuito 
se utiliza en un voltímetro). Sea v(t) el voltaje (en volts) en el 
tiempo r, medido a través del condensador. Es posible demostrar 
que v está en el espacio nulo H de la transformación lineal que 
mapea v(t) en Lv"(t) + Rv'(t) + (1/ C)v(t), y H se compone 
de todas las funciones de la forma v(t) = e~ h, (c\ + C 2 O. Encuen¬ 
tre una base para H. 


Fuente 
de voltaje 



Los ejercicios 29 y 30 indican que cada base de R" debe contener 
exactamente n vectores. 
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29. Sea5'= {vi,..., v*} un conjunto de k vectores en IR", con k< n. 
Utilice un teorema de la sección 1.4 para explicar por qué S no 
puede ser una base para IR". 

30. Sea S = {vi,..., v*} un conjunto de k vectores en IR", con 
k > n. Utilice un teorema del capítulo 1 para explicar por qué 
S no puede ser una base para IR". 

Los ejercicios 31 y 32 revelan una importante conexión entre la in¬ 
dependencia lineal y las transformaciones lineales, y le permiten 
practicar el uso de la definición de dependencia lineal. Sean V y W 
espacios vectoriales, sea T: V —» VL una transformación lineal, y sea 
{vi,..., \ p } un subconjunto de V. 

31. Demuestre que si {vi,..., \ p } es linealmente dependiente en 
V , entonces el conjunto de imágenes, {r(vf),..., T(v p )} es li¬ 
nealmente dependiente en W. Este hecho demuestra que si una 
transformación lineal mapea un conjunto {vi,..., v^} en un con¬ 
junto linealmente independiente { 7\vi),..., T(\ p )}, entonces el 
conjunto original es linealmente independiente también (porque 
no puede ser linealmente dependiente). 

32. Suponga que T es una transformación uno a uno, de modo que 
la ecuación 7\u) = T(\) siempre implica que u = v. Demuestre 
que si el conjunto de imágenes ¡r(Vi),..., 7’(v /J 9 } es linealmente 
dependiente, entonces {vi,..., \ p } es iinealmente dependiente. 
Este hecho demuestra que una transformación lineal uno a uno 
mapea un conjunto linealmente independiente sobre un conjun¬ 
to Iinealmente independiente (porque en este caso el conjunto 
de las imágenes no puede ser linealmente dependiente). 

33. Considere los polinomios pi(f) = 1 + t 2 y pjú) = 1 — t 2 . 
¿Es {pi, p 2 ¡ un conjunto linealmente independiente en P 3 ? 
¿Por qué? 

34. Considere los polinomios pi(í) = 1 + t, P 2 O) = 1 — t, y 
P 3(0 = 2 (para toda t). Por inspección, escriba una relación de 


dependencia lineal entre pi, P 2 y P 3 . Después encuentre una 
base para Gen ¡pi, P 2 , P 3 }- 

35 . Sea V un espacio vectorial que contiene un conjunto linealmen¬ 
te independiente {ui, 112, 113, 114}. Explique cómo construir un 
conjunto de vectores (vi, V2, V3, V4} en V tal que {vi, V3} sea una 
base para Gen ¡Vi, V2, V3, V4}. 

36 . [M] Sea H = Gen {ui, 112, 113} y K = Gen {vi, V2, V3}, 
donde 



1" 


0" 


3" 


2 


2 


4 

Ui = 

0 

. «2 = 

-1 

. u 3 = 

1 


-1 


1 


-4 


2" 


2~ 


~-l ~ 


-2 


3 


4 

Vi = 

-1 

. v 2 = 

2 

. V 3 = 

6 


3 


-6 


-2 


Encuentre las bases para H, Ky H + K. (Véase los ejercicios 33 y 34 
en la sección 4.1). 

37. [M] Demuestre que ¡t, sen t, eos 2 1, sen t eos t } es un con¬ 
junto linealmente independiente de funciones definidas en IR. 
Comience suponiendo que 

C\ ‘ t + c 2 ■ sen t + C 3 ■ eos 2f + C 4 • sen t eos t = 0 (5) 

La ecuación (5) debe ser válida para toda t real, así que elija 
varios valores específicos de t (es decir, t = 0 , .1, .2) hasta ob¬ 
tener un sistema de ecuaciones suficientes para determinar que 
todas las c¡ deben ser cero. 

38. [M] Demuestre que ¡1, eos t, eos 2 ?,..., cos 6 f} es un conjunto 
linealmente independiente de funciones definidas en IR. Utilice 
el método del ejercicio 37. (Este resultado se necesitará en el 
ejercicio 34 de la sección 4.5). 


WEB 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Sea A = [vi V 2 ]. Las operaciones de fila muestran que 


1 

-2" 


"1 

-2" 

-2 

7 

~ 

0 

3 

3 

-9 


0 

0 


No todas las filas de A contienen una posición pivote. De manera que las columnas de A 
no generan a IR 3 , de acuerdo con el teorema 4 de la sección 1.4. Por lo tanto, {vi, V 2 } no es 
una base para R 3 . Ya que Vi y V 2 no están en R 2 , no pueden ser la base de R 2 . Sin embargo, 
puesto que es evidente que Vi y V 2 son linealmente independientes, son una base para un 
subespacio de R 3 , a saber. Gen ¡vi, V 2 }. 

2. Construya una matriz cuyo espacio columna sea el espacio generado por {vi, V2, V3, V4¡, 
y después reduzca por filas a A para encontrar sus columnas pivote. 



1 

6 

2 

-4" 


"1 

6 

2 

-4“ 


" 1 

6 

2 

-4" 

A = 

-3 

2 

-2 

-8 


0 

20 

4 

-20 


0 

5 

1 

-5 


4 

-1 

3 

9 


0 

-25 

-5 

25 


0 

0 

0 

0 
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Las dos primeras columnas de A son las columnas pivote y, por consiguiente, forman una 
base de Col A = W. Por lo tanto, {vi, V 2 } es una base para W. Observe que no se necesita 
la forma escalonada reducida de A para localizar las columnas pivote. 

3. Ni Vi ni V 2 están en H, por lo que {vi, V 2 } no puede ser una base para H. De hecho, 
{Vi, V 2 Í es una base para el plano de todos los vectores de la forma (ci, C 2 , 0), pero H es 
solo una recta. 


4.4J SISTEMAS DE COORDENADAS 

Una razón importante para especificar una base B para un espacio vectorial V es imponer 
un “sistema de coordenadas” en V. En esta sección se mostrará que si B contiene n vectores, 
entonces el sistema de coordenadas hará que V actúe como IR". Si V es ya R” mismo, entonces 
B determinará un sistema de coordenadas que da una nueva perspectiva a V. 

La existencia de sistemas de coordenadas se basa en el siguiente resultado fundamental. 


TEOREMA 7 Teorema de la representación única 

Sea B = (bi,_, b„} una base para un espacio vectorial V. Así, para cada x en V, existe 

un conjunto único de escalares ci,.. c n tal que 

x = cibi + ••• + c„b„ ( 1 ) 


DEMOSTRACIÓN Puesto que B genera a V, existen escalares tales que la ecuación (1) es 
válida. Suponga que x también tiene la representación 


x — d{h\ + • • • + d„b„ 

para escalares di,..., cl n . Así, al restar, se tiene 

0 = x — x = (ci — d\)b\ -i-b (c„ — d„)b„ ( 2 ) 

Puesto que B es linealmente independiente, los pesos en la ecuación (2) deben ser cero. 
Es decir, c¡ = dj para 1 < j < n. ■ 


DEFINICION Suponga que B = {bi,_, b„} es una base para V y que x está en V. Las coordenadas 

de x respecto de la base 13 (o las B-coordenadas de x) son los pesos ci,..., c„ tales 
que x = nbi + ••• + c„b„. 


Si c 1 ,..., c n son las B-coordenadas de x, entonces el vector en R" 


c 1 


[ X ]b 


Cn 


es el vector de coordenadas de x (respecto de B), o el vector de B-coordenadas de x. 
El mapeo xh> [ x ] B es el mapeo de coordenadas (determinado por B). 1 


1 El concepto de un mapeo de coordenadas supone que la base B es un conjunto indexado cuyos vectores se listan 
en un orden fijo asignado con anterioridad. Esta propiedad hace que la definición de [ x ]& no sea ambigua. 
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EJEMPLO 1 Considere una base B = {bi,b 2 } para R 2 , donde b] = 


y b 2 = 


Supongamos que una x en R 2 tiene el vector de coordenadas [ x ] 


-2 

3 


. Determine x. 


SOLUCIÓN Las coordenadas B de x nos dicen cómo construir x a partir de los vectores 
en B. Es decir. 


x = (— 2 )bi + 3 b 2 = (-2) 

EJEMPLO 2 Las entradas en el vector x = 
la base estándar £ = {e 2 , e 2 }, ya que 


+ 3 


1 


+ 6 - 


son las coordenadas de x respecto de 


1 * + 6 • e 2 


Si £ = {ei, e 2 }, entonces [ x ] = x. 


Una interpretación gráfica de coordenadas 


Un sistema de coordenadas en un conjunto se compone de un mapeo uno a uno de los pun¬ 
tos en el conjunto dentro de R". Por ejemplo, el papel común para gráficas proporciona un 
sistema de coordenadas del plano cuando se seleccionan ejes perpendiculares y una unidad 
de medida en cada eje. La figura 1 muestra la base estándar { ei, e 2 ¡, los vectores bi (= ei) y 


b 2 del ejemplo 1 , y del vector x = 


. Las coordenadas 1 y 6 dan la ubicación de x 


respecto de la base estándar: 1 unidad en la dirección ei y 6 unidades en la dirección e 2 . 

La figura 2 muestra los vectores bi, b 2 y x de la figura 1. (Desde el punto de vista geo¬ 
métrico, los tres vectores se encuentran en una recta vertical en ambas figuras). Sin embar¬ 
go, el sistema de coordenadas estándar se borró y se remplazó por una malla especialmente 


adaptada a la base B del ejemplo 1. El vector de coordenadas [ x ] g 



da la ubicación 


de x en este nuevo sistema de coordenadas: —2 unidades en la dirección bi y 3 unidades en 
la dirección b 2 . 




FIGURA 1 FIGURA 2 

Papel cuadriculado estándar. Papel para gráficas B. 


EJEMPLO 3 En cristalografía, la descripción de una red cristalina se mejora eligiendo 
una base ¡u, v, w} para R 3 que corresponda a tres aristas adyacentes de una “celda unitaria” 
del cristal. Se construye una red entera apilando muchas copias de una sola celda. Hay 14 
tipos básicos de celdas unitarias; en la figura 3, se muestran tres. 2 


2 Adaptado de The Science and Engineeríng of Materials, 4a. edición, por Donald R. Askeland (Boston: Prindle, 
Weber & Schmidt © 2002), p. 36. 
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a) 

Monoclínica 

simple 


b) 

Cúbica centrada 
en el cuerpo 


FIGURA 3 Ejemplos de celdas unitarias. 


c) 

Ortorrómbica centrada 
en la cara 


Las coordenadas de los átomos dentro del cristal están dadas respecto de la base de la 
red. Por ejemplo, 

“ 1 / 2 “ 

1/2 

1 

identifica el átomo centrado en la cara superior de la celda en la figura 3 c). ■ 


Coordenadas en U n 

Cuando una base B para IR" está fija, el vector de coordenadas B de una x dada es fácil de 
determinar, como se muestra en el siguiente ejemplo. 


EJEMPLO 4 Sean bi 




{bi, b 2 }. Determine el 


vector de coordenadas [ x ] fi de x respecto de B. 


SOLUCIÓN Las coordenadas B de Ci, c 2 de x satisfacen 



'2' 


'-1' 


'4' 

Ci 

1 

+ Cl 

1 

— 

5 


b, b 2 x 



'2 


O 



1 

1J 

L C 2. 


LsJ 


bi b 2 x 

Esta ecuación se puede resolver mediante operaciones de fila en 
o utilizando la inversa de la matriz a la izquierda. En cualquier caso, 
c 2 = 2. Por lo tanto, x = 3b¡ + 2b 2 , y 


= 


O 

C 2 


FIGURA 4 El vector de 

coordenadas B de x es (3, 2). Véase la figura 4. 


( 3 ) 


una matriz aumentada 
la solución es c\ = 3, 


La matriz en la ecuación (3) cambia las coordenadas B de un vector x en las coordenadas 
estándar para x. Es posible realizar un cambio análogo de coordenadas en R" para una base 
B={ b,.b„ }. Sea 

P B = {b, b 2 ••• b„| 
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Entonces la ecuación vectorial 


X — C] b 1 + C 2 Í )2 + • • • + c„b„ 


es equivalente a 

x = PbW b (4) 

Se llama P B a la matriz de cambio de coordenadas de B a la base estándar en IR". Multi¬ 
plicando por la izquierda a P B se transforma al vector de coordenadas [x] g en x. La ecua¬ 
ción de cambio de coordenadas (4) es importante y será necesaria en varias secciones de 
los capítulos 5 y 7. 

Puesto que las columnas de P B forman una base para R", P B es invertible (por el teo¬ 
rema de la matriz invertible). Al multiplicar por la izquierda por P B 1 se convierte a x en 
su vector de coordenadas B: 


V x = [ x ] e 

La correspondencia x *—> [x]g, producida aquí por P B *> es el mapeo de coordenadas men¬ 
cionado anteriormente. Ya que P B * es una matriz invertible, el mapeo de coordenadas es 
una transformación lineal uno a uno de R" en R", de acuerdo con el teorema de la matriz 
invertible. (Véase también el teorema 12 de la sección 1.9). Esta propiedad del mapeo de 
coordenadas también es cierto en un espacio vectorial general que tiene una base, como se 
verá más adelante. 


El mapeo de coordenadas 

La elección de una base B = {bi,...,b„} de un espacio vectorial V introduce un sistema de 
coordenadas en V. El mapeo de coordenadas x^[x] g conecta al espacio V, posiblemente 
desconocido, con el conocido espacio R". Véase la figura 5. Los puntos de V ahora se pueden 
identificar por sus nuevos “nombres”. 



FIGURA 5 El mapeo de coordenadas de V sobre IR". 


TEOREMA 8 


Sea B = {bi,..., b„ } una base para un espacio vectorial V. Así, el mapeo de coordenadas 
x l-> [ x ]g es una transformación lineal uno a uno de V en R". 


DEMOSTRACIÓN Tome dos vectores típicos en V, por ejemplo. 


u = cqbi 4-1- c„b„ 

w = d ibi -I - 1- d„b„ 


Luego, utilizando las operaciones de vectores, 


U + w = (ci + d i)bi -I- b (c„ + d„)b, 
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De ello se sigue que 

Ci + d\ 1 fcil r d\ 

[u + w] g = : = : + : =[u] B + [w] B 

Cn + d n I I Cjj I I d n I 

Por lo tanto, el mapeo de coordenadas conserva la adición. Si r es un escalar cualquiera, 
entonces 

ru = r(cibi H-b c„b„) = (rcijb] -I-b (rc„)h„ 

De esta forma. 



Así, el mapeo de coordenadas también conserva la multiplicación escalar, y por consiguiente, 
es una transformación lineal. Véase los ejercicios 23 y 24 para comprobar que el mapeo de 
coordenadas es uno a uno y mapea V sobre R". ■ 

La linealidad del mapeo de coordenadas se extiende a las combinaciones lineales, al igual 
que en la sección 1.8. Si ui,..., u ; , están en V y si ci,..., c p son escalares, entonces 

[ctui +-b c p u p } B = ci[m ] g +-b c p [u p ] B (5) 

Es decir, (5) nos dice que el vector de Z?-coordenadas de una combinación lineal de ui,..., u,, 
es la misma combinación lineal de sus vectores de coordenadas. 

El mapeo de coordenadas en el teorema 8 es un importante ejemplo de un isomorfismo 
de V en R". En general, una transformación lineal uno a uno de un espacio vectorial V en 
un espacio vectorial W se llama isomorfismo de V en W (el término proviene de los voca¬ 
blos griegos iso, que significa “lo mismo”, y morfé , que significa “forma” o “estructura”). 
La notación y la terminología para V y W pueden diferir, pero los dos espacios son indistin¬ 
guibles como espacios vectoriales. Cada cálculo de espacio vectorial en V se reproduce con 
exactitud en W, y viceversa. En particular, cualquier espacio vectorial real con una base de 
n vectores es indistinguible de R". Véase los ejercicios 25 y 26. 

EJEMPLO 5 Sea B la base estándar del espacio P 3 de polinomios; es decir, sea 
B = { 1, t, t 2 , f 3 }. Un elemento típico p de P3 tiene la forma 

p(í) = üq + ü\t -b ünt~ ~b Cí^t^ 

Puesto que p ya se ha desplegado como una combinación lineal de los vectores básicos es¬ 
tándar, concluimos que 



Así, el mapeo de coordenadas p [ p ] fí es un isomorfismo de P3 sobre R 4 . Todas las opera¬ 
ciones de espacio vectorial en P3 corresponden a operaciones en R 4 . ■ 

Si pensamos en P3 y R 4 como despliegues en dos pantallas de computadora que se 
conectan a través del mapeo de coordenadas, entonces cada operación de espacio vectorial 
en P3 en una pantalla es duplicada exactamente por una operación vectorial correspondien¬ 
te en R 4 en la otra pantalla. Los vectores en la pantalla P3 tienen un aspecto diferente res¬ 
pecto de los que aparecen en la pantalla de R 4 , pero “actúan” como vectores exactamente de 
la misma forma. Véase la figura 6. 
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FIGURA 6 El espacio P3 es isomorfo a IR 4 . 


EJEMPLO 6 Utilice vectores de coordenadas para comprobar que los polinomios 1 + 2 1 2 , 
4 + t + 5 1 2 , y 3 + 2 1 son linealmente dependientes en P 2 . 

SOLUCION El mapeo de coordenadas del ejemplo 5 produce los vectores de coordenadas 
(1,0, 2), (4, 1, 5) y (3,2, 0), respectivamente. Al representar estos vectores como las columnas 
de una matriz A, podemos determinar su independencia mediante reducción por fdas de la 
matriz aumentada de Ax = 0: 


" 1 

4 

3 

0 


"1 

4 

3 

0 " 

0 

1 

2 

0 

~ 

0 

1 

2 

0 

2 

5 

0 

0 


0 

0 

0 

0 


Las columnas de A son linealmente dependientes, por lo que los polinomios correspondien¬ 
tes son linealmente dependientes. De hecho, es fácil comprobar que la columna 3 de A es la 
columna 2 multiplicada por 2, menos la columna 1 multiplicada por 5. La relación correspon¬ 
diente de los polinomios es 


3 + 2t = 2(4 + t + 5t 2 ) -5(1 + 2í 2 ) ■ 

El último ejemplo se refiere a un plano en R 3 que es isomorfo a IR 2 . 

EJEMPLO 7 Sea 


"3 


-1 


3" 

6 

, v 2 = 

0 

, X = 

12 

2 


1 


7 


y B = {vi, V 2 }. Entonces B es una base para H = Gen {vi, V 2 }. Determine si x se encuentra 
en H y, si lo está, encuentre el vector de coordenadas de x respecto de B. 

SOLUCION Si x está en //, entonces la siguiente ecuación vectorial es consistente: 


C\ 

■3" 

6 

+ C 2 

-1" 

0 

_ 

3" 

12 


2 


1 


7 


Los escalares C\ y C 2 , si existen, son las coordenadas B de x. Usando operaciones de fila, se 
obtiene 


"3 

-1 

3" 


"1 

0 

2" 

6 

0 

12 

~ 

0 

1 

3 

2 

1 

7 


0 

0 

0 
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Así, <?i = 2, C 2 = 3 y [x] 
se muestra en la figura 7. 



El sistema de coordenadas en H determinadas por B 



FIGURA 7 Un sistema de coordenadas en un 
plano H en IR 3 . 


Si se eligiera una base diferente para H, ¿el sistema de coordenadas asociado tam¬ 
bién haría a H isomorfo a IR 2 ? Sin duda, esto debe ser verdad. Así lo demostraremos en la 
siguiente sección. 


PROBLEMAS DE PRÁCTICA 



■ r 


~-3" 


3" 


~-8~ 

1. Sea bi = 

0 

0 

,b 2 = 

4 

0 

,b 3 = 

-6 

3 

y x = 

2 

3 


á) Demuestre que el conjunto B = {bi, b2, b3 ¡ es una base de R 3 . 

b ) Encuentre la matriz de cambio de las coordenadas de B a la base estándar. 

c) Escriba la ecuación que relaciona x en R 3 con [ x ] B . 

d ) Encuentre [ x ] g , para la x dada anteriormente. 

2. El conjunto B = {1 + t, 1 + t 2 , t + t 2 } es una base para P 2 - Encuentre el vector de coor¬ 
denadas de p(í) = 6 + 3í — t 2 en relación con B. 


4.4 EJERCICIOS 


En los ejercicios 1 a 4, encuentre el vector x determinado por el vec- En los ejercicios 5 a 8 , encuentre el vector de coordenadas [ x ] 

tor de coordenadas [ x ] B y la base B. de x respecto de la base B = ¡bi, .... b,,}. 


1 . B = 

2. B = 

3. B = 

4 . B = 



5. 

b, = 

1 ‘ 

—2 

, b 2 = 

3' 

-5 

, X = 

--1" 

1 

6. 

bi = 

f 

—4 

, b 2 = 

2 ' 
_ —3 _ 

, X = 

"-1 " 
-6 


1 _ 

! 

i " 


r-3i 


r 2 i 


8' 

0 

-2 

O* 

II 

-i 

-3 

,b 2 = 

i 

Os 

_1 

b 3 = 

i 

(N tJ- 
1 

_1 

, X = 

-9 

6 



' 1 " 


~2~ 


1 " 


O - 

8. bi = 

1 

, b 2 = 

0 

, b 3 = 

-1 

, X = 

0 


3 


8 


3 


-2 
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En los ejercicios 9 y 10, encuentre la matriz de cambio de coordena¬ 
das de B a la base estándar en IR". 


{vi,..., V4} para obtener otra representación de w como una 
combinación lineal de Vi,..., V4]. 


9. 




En los ejercicios 11 y 12, utilice una matriz inversa para encontrar 
[x ] para x y B. 



12. B = 




2 

3 


13. El conjunto B — {1 + í 2 , t + t 2 , 1 + 2t + t 2 } es una base 
para P 2 . Encuentre el vector de coordenadas de p(í) = 1 + 
4 1 + lt 2 respecto de B. 

14. El conjunto B = {1 — í 2 , t — t 2 , 2 — t + t 2 } es una base para 
P 2 . Encuentre el vector de coordenadas de p(í) = 1 + 3? — 6 í 2 
respecto de B. 


En los ejercicios 15 y 16, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. A menos que se indique lo con¬ 
trario. B es una base para un espacio vectorial V. 


15. a) Si x está en V y si B contiene n vectores, entonces el vector 

de coordenadas B de x está en IR". 

b ) Si Pb es la matriz del cambio de coordenadas, entonces 

[ x ] = P B x, para x en V. 

c ) Los espacios vectoriales P 3 y IR 3 son isomorfos. 

16. a) Si B es la base estándar para IR", entonces el vector de coor¬ 

denadas B de una x en IR" es x misma. 

b ) La correspondencia [x] fi ^xse llama el mapeo de coorde¬ 
nadas. 

c) En algunos casos, un plano en IR 3 puede ser isomorfo a IR 2 . 



1 ' 


2 ' 


'-3' 

vectores vi = 

_ —3 _ 

, v 2 = 

_ —8 _ 

, v 3 = 

7 _ 


generan 

a IR 2 , pero no forman una base. Encuentre formas diferentes de 

1 ' 


expresar 


1 


como una combinación lineal de vi, V2, V3. 


18. Sea B = {bi,..., b„) una base para un espacio vectorial V. 
Explique por qué los vectores de coordenadas B de bi,..., b„ 
son las columnas ei,..., e„ de la matriz identidad de n x n. 

19. Sea S un conjunto finito en un espacio vectorial V con la pro¬ 
piedad de que cada x en V tiene una representación única como 
una combinación lineal de elementos de S. Demuestre que S 
es una base de V. 

20. Suponga que ¡vi...., V4) es un conjunto linealmente dependiente 
que genera un espacio vectorial V. Demuestre que cada w en V 
se puede expresar en más de una forma como una combinación 
lineal de Vi,..., V 4 . [Sugerencia: Considere w = /qvi + ••• + 
Í. 4 V 4 un vector arbitrario en V. Utilice la dependencia lineal de 


j. Puesto que el mapeo de coordena¬ 
das determinado por B es una transformación lineal de IR 2 
en IR 2 , este mapeo se debe implementar mediante alguna ma¬ 
triz A de 2 x 2. Encuéntrela. [Sugerencia: La multiplicación 
por A debería transformar un vector x en su vector de coorde¬ 
nadas [ x ] ]. 

22. SeaZ?= {bi...., b„} una base para IR". Obtenga una descripción 
de una matriz A de n x n que implemente el mapeo de coorde¬ 
nadas x >-» [ x ] B . (Véase el ejercicio 21). 

Los ejercicios 23 a 26 se refieren a un espacio vectorial V, una base 

B = {br,..., b„}, y el mapeo de coordenadas x^[x] g . 

23. Demuestre que el mapeo de coordenadas es uno a uno. 
(Sugerencia: Suponga que [ u ] B = [ w ] B para algunas u y w 
en V, y demuestre que u = w). 

24. Demuestre que el mapeo de coordenadas es sobre IR". Es decir, 
dada cualquier y en IR", con entradas yi,..., y,„ obtenga u en V 
tal que [u] B = y. 

25. Demuestre que un subconjunto {ui,..., u,,} en V es linealmente 

independiente si y solo si el conjunto de vectores de coordena¬ 
das {[ ui ] B .[u^ ] B } es linealmente independiente en IR". 

( Sugerencia: Como el mapeo de coordenadas es uno a uno, las 
siguientes ecuaciones tienen las mismas soluciones, ci,..., c p ). 

C 1 U 1 + • ■ • + CpVLp = 0 El vector cero en V 

[ciui + ••■ + c^Upjg = [0] g El vector cero en IR" 

26. Dados los vectores ui,..., u p , y w en V, demuestre que w es 

una combinación lineal de Ui,..., u p si y solo si [w] B es una 
combinación lineal de los vectores de coordenadas 
[ui ] B .[u p ] B . 

En los ejercicios 27 a 30, utilice los vectores de coordenadas para 

probar la independencia lineal de los conjuntos de polinomios. 

Explique su trabajo. 

27. 1 + 2t\ 2 + t- 3í 2 , -t + 2t 2 - t 3 

28. 1 -2t 2 - t\ t + 2 r 3 , 1 + t -2t 2 

29. (1 -t) 2 , t-2t 2 + t 3 , (1 -t) 3 

30. (2 — t) 3 , (3 — t) 2 , 1 + 6í — 5f 2 + t 3 


21. Sea B = 


1 

-4 


31. Utilice los vectores de coordenadas para comprobar si los si¬ 
guientes conjuntos de polinomios generan a P 2 . Justifique sus 
conclusiones. 

a) 1 — 3r + 5í 2 , -3 + 5f - lt 2 , -4+5 1- 6 1 2 , 1 - í 2 

b) 51 + t 2 , 1 - 8 í - 2í 2 , —3 + 4? + 2í 2 , 2-3 1 


32. Sea p,(t) = 1 + t 1 , p 2 (r) = t — 3 1 2 , p 3 (í) = 1 + t — 3í 2 . 
a) Utilice vectores de coordenadas para demostrar que estos 
polinomios forman una base para P 2 - 

tí) Considere de la base B = ¡pi. P 2 , P 3 } para P 2 . Encuentre 


q en P 2 , considerando que [q]g 


-1 

1 

2 
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En los ejercicios 33 y 34, determine si el conjunto de polinomios 
forman una base para P 3 . Justifique sus conclusiones. 

33. [M] 3 + 7?, 5 + t - 2 1 \ t - 21 2 ,1 + 16? - 6 1 2 + 2 1 3 

34. [M] 5 - 3? + 4 ? 2 + 2t\9 + t + 8? 2 - 6 ? 3 , 6 - 2? + 5 f 2 , t 3 

35. [M] Sea tí = Gen {vi, V 2 } y B = {vi, V 2 }. Demuestre que x 
está en tí y encuentre el vector de coordenadas B de x, para 


' ir 


' 14' 


19' 

-5 


-8 


-13 

10 

.V 2 = 

13 

, X = 

18 

7 


10 


15 


36. [M] Sea tí = Gen {vi, V2, V3) y B = {vi, V2, V3J. Demuestre 
que B es una base para tí y que x está en tí, y encuentre el vec¬ 
tor de coordenadas B de x, para 


"-6" 


8 


~-9~ 


4' 

4 


-3 


5 


7 

-9 

,v 2 = 

7 

. v 3 = 

-8 

, X = 

-8 

4 


-3 


3 


3 


[M] Los ejercicios 37 y 38 se refieren a la red cristalina del tita¬ 
nio, que tiene la estructura hexagonal que se ilustra a la izquierda 


en la figura adjunta. Los vectores 

2.6 

-1.5 


"0” 

3 


0 

0 


0 


0 


4.8 


forman una base para la celda unitaria de la derecha. Los números 
están en unidades angstrom (1 A = 10~ 8 cm). En las aleaciones de 


titanio, algunos átomos adicionales pueden estar en la celda unitaria 
en los sitios octaédricos y tetraédricos (llamados así por los objetos 
geométricos que forman los átomos en estos lugares). 



La red compacta hexagonal y su celda unitaria. 


37. Uno de los sitios octaédricos es 


1/2 

1/4 

1/6 


, respecto de la base 


de la red. Determine las coordenadas de este sitio en relación 
con la base estándar de IR 3 . 


38. Uno de los sitios tetraédricos es 


1/2 

1/2 

1/3 


. Determine las coor¬ 


denadas de este sitio en relación con la base estándar de IR 3 . 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. a) Es evidente que la matriz P B = [ t>i 1*2 b< ] es equivalente por filas a la matriz 
de identidad. Por el teorema de la matriz invertible, P B es invertible y sus columnas 
forman una base de IR 3 . 


b) Del inciso a), la matriz de cambio de coordenadas es P B 


1 -3 3 

0 4-6 

0 0 3 


c) x = Pb[*] b 

d) Para resolver la ecuación en c), es probable que sea más fácil de reducir por filas una 
matriz aumentada que calcular P B '■ 


"1 -3 

3 

-8 


" 1 

0 

0 

- 5 " 

0 4 

-6 

2 


0 

1 

0 

2 

1- 

O 

O 

3 

3 


0 

0 

1 

1 

Pb 


X 


/ 


[x] B 


De ahí que 

[*£¡] 



2. Las coordenadas de p(f) = 6 + 3? — t 2 respecto de B satisfacen 

ci(l + í) + C 2 (l + t~) + c^(t + t 2 ) = 6+3 1 — t~ 
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Al igualar los coeficientes de potencias de t, se tiene que 

c\ + c 2 =6 
C\ + c 3 = 3 

C2 + C3 = — 1 


Al resolver, se encuentra que Ci = 5, C 2 = 1, C 3 = —2 y [ p ] B 


5 

1 

-2 


4.5 LA DIMENSIÓN DE UN ESPACIO VECTORIAL 

El teorema 8 de la sección 4.4 implica que un espacio vectorial V con una base B que con¬ 
tiene n vectores es isomorfo a R". En esta sección veremos que este número n es una propie¬ 
dad intrínseca (llamada dimensión) del espacio V que no depende de la elección particular 
de la base. El análisis de la dimensión le ayudará a comprender mejor las propiedades de las 
bases. 

El primer teorema generaliza un resultado bien conocido acerca del espacio vectorial R". 


TEOREMA 9 


Si un espacio vectorial V tiene una base B = { b ]. b„ }, entonces cualquier conjunto 

en V que contenga más de n vectores debe ser linealmente dependiente. 


DEMOSTRACIÓN Sea {u 1 ,..., u ; ,} un conjunto de V con más de n vectores. Los vectores de 
coordenadas [ ] g ,..., [ u p ] e forman un conjunto linealmente dependiente en R", porque 

hay más vectores ( p) que entradas (n) en cada vector. Por lo tanto, existen escalares C|,..., c p , 
no todos cero, tales que 


0 





El vector cero en R” 


Como el mapeo de coordenadas es una transformación lineal, 


[cmi 4-h c p u p ] B 


0 


0 


El vector cero de la derecha muestra los n pesos necesarios para construir el vector 
C 1 U 1 + ••• + CpUp de los vectores básicos en B. Es decir, ciUi + + c p u /; = 

0 • bi + ••• + 0 • b„ = 0. Puesto que no todas las c, son cero, {ui,..., u ; ,| es linealmente 
dependiente. 1 ■ 

El teorema 9 implica que si un espacio vectorial V tiene una base B = {b 1 ,..., b„} , en¬ 
tonces cada conjunto linealmente independiente ubicado en V no tiene más de n vectores. 


1 El teorema 9 también se aplica a los conjuntos infinitos en V. Se dice que un conjunto infinito es linealmente 
dependiente si algún subconjunto finito es linealmente dependiente; de lo contrario, el conjunto es linealmente inde¬ 
pendiente. Si Ses un conjunto infinito de V , tome cualquier subconjunto {ui,..., u p } de 5, con p > n. La demostración 
anterior indica que este subconjunto es linealmente dependiente y, por lo tanto, también lo es S. 
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Si un espacio vectorial V tiene una base de n vectores, entonces toda base de V debe 
consistir exactamente en n vectores. 

DEMOSTRACION Sea B\ una base de n vectores y £>2 cualquier otra base (de V). Ya que 
B\ es una base y £>2 es linealmente independiente, £>2 no tiene más de n vectores, de acuerdo 
con el teorema 9. Además, puesto que £L es una base y B¡ es linealmente independiente, 
B 2 tiene al menos n vectores. Así, £>2 se compone de exactamente n vectores. ■ 

Si un espacio vectorial V distinto de cero es generado por un conjunto finito S , entonces 
un subconjunto de S es una base para V, de acuerdo con el teorema del conjunto generador. 
En este caso, el teorema 10 asegura que la siguiente definición tiene sentido. 

DEFINICIÓN 


Si V es generado por un conjunto finito, entonces se dice que V tiene dimensión finita, 
y la dimensión de V, representada como dim V, es el número de vectores en una base 
para V. La dimensión del espacio vectorial cero ¡0} se define como cero. Si V no es 
generado por un conjunto finito, entonces se dice que V tiene dimensión infinita. 


EJEMPLO 1 La base estándar para R" contiene n vectores, por lo que dim R" = n. 
La base polinomial estándar {1, í, t 2 } indica que dim P 2 = 3. En general, dim P„ = n + 1. 
El espacio P de todos los polinomios es de dimensión infinita (ejercicio 27). ■ 



EJEMPLO 2 Sea H = Gen ¡Vi, V 2 }, donde vi 


y v 2 


. Entonces H es 


el plano estudiado en el ejemplo 7 de la sección 4.4. Una base para H es {vj, V 2 }, ya que 
Vi y V 2 no son múltiplos y, por consiguiente, son linealmente independientes. Por lo tanto, 
dim H = 2. ■ 

EJEMPLO 3 Encuentre la dimensión del subespacio 




a — 3b + 6c 


H = • 


5 a + 4 d 
b — 2c — d 

: a, b, c, d en R 


. 

5 d 



SOLUCIÓN Es fácil ver que H es el conjunto de todas las combinaciones lineales de los 
vectores 


T 


"-3 


6" 


0" 

5 


0 


0 


4 

0 

, V 2 = 

1 

, v 3 = 

-2 

. v 4 = 

-1 

0 


0 


0 


5 


Claramente, vi * 0, V 2 no es un múltiplo de Vi, pero V 3 es un múltiplo de V 2 . De acuerdo con 
el teorema del conjunto generador, podemos descartar a V 3 y aún así tener un conjunto gene¬ 
rador H. Finalmente, V4 no es una combinación lineal de V| y V 2 . Por lo tanto, {vi, V2, V4} es 
linealmente independiente (de acuerdo con el teorema 4 de la sección 4.3) y, en consecuencia, 
es una base para H. Por consiguiente, dim H = 3. ■ 


EJEMPLO 4 Los subespacios de R 3 se pueden clasificar por dimensiones. Véase la figura 1. 
Subespacios de dimensión 0. Solo el subespacio cero. 

Subespacios de dimensión 1. Cualquier subespacio generado por un solo vector distinto 
de cero. Tales subespacios son rectas que pasan por el origen. 
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TEOREMA 1 


TEOREMA 1 


Subespacios de dimensión 2. Cualquier subespacio generado por dos vectores lineal¬ 
mente independientes. Tales subespacios son planos que pasan por el origen. 
Subespacios de dimensión 3. Solo el propio IR 3 . Cualesquiera tres vectores linealmen¬ 
te independientes en R 3 generan todo R 3 , de acuerdo con el teorema de la matriz 
invertible. ■ 




FIGURA 1 Subespacios muestra de IR 3 . 

Subespacios de un espacio de dimensión finita 

El siguiente teorema es una contraparte natural del teorema del conjunto generador. 


Sea H un subespacio de un espacio vectorial de dimensión finita V. Cualquier con¬ 
junto linealmente independiente en H se puede expandir, si es necesario, a una base 
de H. Además, H tiene dimensión finita y 

dim H < dim V 


DEMOSTRACIÓN Si H = ¡0}, entonces, sin duda, dim H = Os dim V. De lo contrario, sea 
S = {ui,..., Ujt} cualquier conjunto linealmente independiente en //. Si S genera a H, enton¬ 
ces S es una base para H. De lo contrario, existe algún u*-+i en H que no está en el generado 
por S. Pero entonces {ui,..., u¿, u^+i} será linealmente independiente, ya que ningún vector 
en el conjunto puede ser una combinación lineal de los vectores que le preceden (de acuerdo 
con el teorema 4). 

En tanto que el nuevo conjunto no genere a H, podemos continuar con este proceso 
de expansión de S a un conjunto más amplio linealmente independiente en H. Sin embargo, 
el número de vectores en una expansión linealmente independiente de S nunca podrá superar 
la dimensión de V , de acuerdo con el teorema 9. Así, finalmente la expansión de S generará 
a H y, por lo tanto, será una base para //, y dim H < dim V. ■ 

Cuando se conoce la dimensión de un espacio o subespacio vectorial, la búsqueda de 
una base se simplifica con el siguiente teorema, el cual dice que si un conjunto tiene el nú¬ 
mero correcto de elementos, entonces solo se tiene que demostrar ya sea que el conjunto 
es linealmente independiente o que este genera el espacio. El teorema es de importancia 
fundamental en muchos problemas de aplicación (por ejemplo, los que implican ecuaciones 
diferenciales o ecuaciones en diferencias), donde la independencia lineal es mucho más fácil 
de comprobar que la generación. 


El teorema base 

Sea V un espacio vectorial de dimensión p, donde p > 1. Cualquier conjunto lineal¬ 
mente independiente de exactamente p elementos en V es, de forma automática, una 
base para V. Cualquier conjunto de exactamente p elementos que genera a V es, de 
manera automática, una base para V. 
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CAPITULO 4 


Espacios vectoriales 


DEMOSTRACIÓN De acuerdo con el teorema 11, un conjunto linealmente independiente 
S de p elementos se puede ampliar a una base para V. Sin embargo, esa base debe conte¬ 
ner exactamente p elementos, ya que dim V = p. Así que S debe ser ya una base para V. 
Ahora suponga que S tiene p elementos y genera a V. Puesto que V es diferente de cero, el 
teorema del conjunto generador implica que un subconjunto S' de S es una base de V. Como 
dim V = p, S' debe contener p vectores. Por lo tanto, S = S'. ■ 


Las dimensiones de Nul A y Col A 

Como las columnas pivote de una matriz A forman una base para Col A, conocemos la di¬ 
mensión de Col A tan pronto como se conocen las columnas pivote. Tal vez parezca que la 
dimensión de Nul A requiere de más trabajo, ya que encontrar una base para Nul A, por lo 
general, toma más tiempo que una base para Col A. Pero, ¡hay un atajo! 

Sea A una matriz de m x n. y supongamos que la ecuación Ax = 0 tiene k variables li¬ 
bres. De la sección 4.2, sabemos que el método estándar para encontrar un conjunto genera¬ 
dor para Nul A producirá exactamente k vectores linealmente independientes, por ejemplo, 
Ui,..., U/,-, uno para cada variable libre. Por lo tanto, {u¡,..., ut-} es una base para Nul A, y el 
número de variables libres determina el tamaño de la base. Hagamos un resumen de estos 
hechos para referencia futura. 


La dimensión de Nul A es el número de variables libres en la ecuación Ax = 0, y la 
dimensión de Col A es el número de columnas pivote de A. 


EJEMPLO 5 Determine las dimensiones del espacio nulo y el espacio columna de 


-3 6 -1 

1 -2 2 
2-4 5 


-7 

-1 

-4 


SOLUCIÓN Reduzca por filas la matriz aumentada [A 0] a la forma escalonada: 


1 -2 

0 0 

0 0 


2 

1 

0 


3 -1 
2 -2 
0 0 


Hay tres variables libres: xi, a '4 y . Por consiguiente, la dimensión de Nul A es 3. Por otra 
parte, dim Col A = 2 porque A tiene dos columnas pivote. ■ 


PROBLEMAS DE PRÁCTICA 

Determine si cada enunciado es verdadero o falso, y dé una razón para cada respuesta. Aquí, 
V es un espacio vectorial de dimensión finita diferente de cero. 

1. Si dim V = p, y si S es un subconjunto linealmente dependiente de V, entonces S con¬ 
tiene más que p vectores. 

2. Si S genera a V y si T es un subconjunto de V que contiene más vectores que S, entonces 
T es linealmente dependiente. 
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4.5 EJERCICIOS 


Para cada subespacio en los ejercicios 1 a 8 , a) encuentre una base 
para el subespacio, y b ) indique la dimensión. 


1 . 


3. 


s — 2t 
s 1 
3 t 

2c 

a — b 
b — 3c 
a + 2b 


P ~ 2q 
2 p + 5r 
—2 q + 2 r 
—3 p + 6 r 


: s, t en I 


2a 

-4b 

—2a 


: a, b en I 


' 



' P + lc í 


: a, b, c en IR 

4. 


~P 

3 P~q 

: p, q en U 




_ p + q _ 

, 


: p, q, r en l 


6 . 



3a — c 

' 


—b — 3c 

: a, b, c en R 


—la + 6 b + 5c 


—3a + c 



7. {(a, b, c) : a — 3b + c = 0, b — 2c = 0, 2b — c = 0} 

8. {(a, b, c, d) : a — 3b + c = 0} 

9. Encuentre la dimensión del subespacio de todos los vectores en 
IR 3 cuyas entradas primera y tercera sean iguales. 

10. Encuentre la dimensión del subespacio H de IR 2 generado por 


1 ' 


r-21 


r- 3 i 

_ —5 _ 

’ 

0 

’ 

ai 


En los ejercicios 11 y 12, encuentre la dimensión del subespacio ge¬ 
nerado por los vectores dados. 



' 1 " 


' 3 " 


~-2~ 


"5~ 

11. 

0 

. 

1 

, 

-1 

, 

2 


2 


1 


1 


2 



1 " 


" —3 ” 


” —2 ~ 


'-3' 

12. 

-2 


-6 


3 

, 

5 


0 


0 


5 


5 


Determine las dimensiones de Nul A y Col A de las matrices que se 


muestran en los 

ejercicios 

13 a 18 





' 1 

-6 

9 

0 - 

2" 



13. A = 

0 

1 

2 

0 

-4 

5 

1 



0 

0 

5 




0 

0 

0 

0 

0 




' 1 

2 

-4 

3 - 

■2 

6 

0 

14. A = 

0 

0 

0 

1 

0 

-3 

7 

0 

0 

0 

0 

1 

4 

-2 


0 

0 

0 

0 

0 

0 

1 



' 1 

-1 

0“ 


' 1 

1 

-1 ' 

17. A = 

0 

1 

3 

18. A = 

0 

2 

0 


0 

0 

1 


0 

0 

0 


En los ejercicios 19 y 20, V es un espacio vectorial. Marque cada 
enunciado como verdadero o falso. Justifique sus respuestas. 

19. a) El número de columnas pivote de una matriz es igual a la 

dimensión de su espacio columna. 

b) Un plano en IR 3 es un subespacio de dimensión 2 de IR 3 . 

c) La dimensión del espacio vectorial P 4 es 4. 

d) Si dim V — n y S es un conjunto linealmente independiente 
en V, entonces S es una base para V. 

e) Si un conjunto {vi,..., \ p ] genera un espacio vectorial V de 
dimensión finita y si T es un conjunto de más de p vectores 
en V, entonces T es linealmente dependiente. 

20. a) IR 2 es un subespacio de dimensión 2 de IR 3 . 

b) El número de variables en la ecuación Ax = 0 es igual a la 
dimensión de Nul A. 

c) Un espacio vectorial es de dimensión infinita si es generado 
por un conjunto infinito. 

d) Si dim V = n, y si S genera a V , entonces S es una base 
de V. 

e) El único subespacio de dimensión 3 de IR 3 es el propio IR 3 . 

21. Los primeros cuatro polinomios de Hermite son 1, 2f, — 2 + 4 1 2 , 
y —12 1 + 8 t 3 . Estos polinomios surgen de forma natural en el 
estudio de ciertas ecuaciones diferenciales importantes en física 
matemática . 2 Demuestre que los primeros cuatro polinomios de 
Hermite forman una base de P 3 . 

22. Los primeros cuatro polinomios de Laguerre son 1,1 — í, 
2 — 4í + t 2 , y 6 — 18t + 9t 2 — t 3 . Demuestre que estos poli¬ 
nomios forman una base de P 3 . 

23. Sea B la base de P 3 que consta de los polinomios de Hermite 
en el ejercicio 21, y sea p(í) = — 1 + 8? 2 + 8 f 3 . Encuentre el 
vector de coordenadas de p respecto de B. 

24. Sea B la base de P 9 que consiste en los tres primeros polino¬ 
mios de Laguerre listados en el ejercicio 22, y sea p(t) = 5 + 
5 1 — 21 2 . Encuentre el vector de coordenadas de p respecto 
de B. 

25. Sea S un subconjunto de un espacio vectorial V de dimen¬ 
sión n, y suponga que S contiene menos de n vectores. Explique 
por qué S no puede generar a V. 

26. Sea H un subespacio de dimensión n de un espacio vectorial V 
de dimensión n. Demuestre que H = V. 

27. Explique por qué el espacio P de todos los polinomios es un 
espacio de dimensión infinita. 



' 1 

2 

3 

0 

0 " 


O 

0 ~ 

A = 

0 

0 

1 

0 

1 

16. A = 

D 

z 







—6 

5 


0 

0 

0 

1 

0 





2 Véase lntroduction to Functional Analysis, 2a. edición, por A. E. Taylor y 
David C. Lay (NuevaYork: John Wiley & Sons, 1980), pp. 92-93. También se 
analizan otros conjuntos de polinomios. 
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28. Demuestre que el espacio C(R) de todas las funciones continuas 
definidas en la recta real es un espacio de dimensión infinita. 

En los ejercicios 29 y 30, V es un espacio vectorial de dimensión 
finita diferente de cero, y los vectores mencionados pertenecen a V. 
Marque cada enunciado como verdadero o falso. Justifique sus res¬ 
puestas. (Estas preguntas tienen mayor grado de dificultad que las de 
los ejercicios 19 y 20). 

29. a) Si existe un conjunto ¡Vi,..., v^} que genera a V, entonces 

dim V £ p. 

b) Si existe un conjunto linealmente independiente ¡Vi,..., v,,} 
en V, entonces dim fSf 

c) Si dim V = p, entonces existe un conjunto generador de 
p + 1 vectores en V. 

30. a) Si existe un conjunto linealmente dependiente {vi,..., v^} 

en V, entonces dim V £ p. 

b) Si cada conjunto de p elementos en V no genera a V, enton¬ 
ces dim V > p. 

c) Si p £: 2 y dim V = p, entonces cada conjunto de p — 1 
vectores distintos de cero es linealmente independiente. 

Los ejercicios 31 y 32 se refieren a espacios vectoriales V y W de 
dimensión finita y a una transformación lineal T: V —> VE 

31. Sea H un subespacio distinto de cero de V , y sea T(H) el con¬ 
junto de imágenes de vectores en H. Entonces, T(H) es un sub¬ 
espacio de W, de acuerdo con el ejercicio 35 en la sección 4.2. 
Demuestre que dim T(H) £ dim H. 

32. Sea H un subespacio distinto de cero de V, y suponga que T es 
un mapeo uno a uno (lineal) de V en W. Demuestre que dim 
T(H) = dim H. Si resulta que T es un mapeo uno a uno de V 
sobre W, entonces dim V = dim W. Espacios vectoriales iso- 
morfos de dimensión finita tienen la misma dimensión. 


33. [M] De acuerdo con el teorema 11, un conjunto lineal¬ 
mente independiente {vi,..., v¿} en IR" se puede expandir a 
una base para IR". Una manera de hacer esto es crear A = [vi 
Xk ei ••• e„|, siendo ei,..., e„ las columnas de la matriz iden¬ 
tidad; las columnas pivote de A forman una base para IR". 

a) Utilice el método descrito para ampliar los siguientes vec¬ 
tores a una base para IR 5 : 


'-9" 


9" 


6' 

-7 


4 


7 

8 

, v 2 = 

1 

, v 3 = 

-8 

-5 


6 


5 

7 


-7 


-7 


b) Explique por qué funciona en general el método: ¿por qué 
están los vectores originales Vi,..., v* incluidos en la base 
encontrada para Col Al ¿Por qué es Col A = IR"? 

34. [M] Sea B = { 1, eos f, eos 2 í,..., eos 6 t] y C = {1, eos t, 
eos 2t,..., eos 6íj. Suponga las siguientes identidades trigo¬ 
nométricas (véase el ejercicio 37 de la sección 4.1). 

eos 2t = — 1 + 2 eos 2 t 

eos 3 1 = —3 eos t 4-4 eos 3 1 

eos 4í = 1 — 8 eos 2 1 + 8 eos 4 1 

eos 5 1 = 5 eos t — 20eos 3 1 4- lóeos 5 1 

eos 6t = — 1 + 18 eos 2 1 — 48 eos 4 t + 32 eos 6 1 

Sea H el subespacio de funciones generado por las funciones 
en B. Entonces B es una base para H, de acuerdo con el ejerci¬ 
cio 38 de la sección 4.3. 

a) Escriba los vectores de Z3-coordenadas de los vectores en C, 
y utilícelos para demostrar que C es un conjunto linealmente 
independiente en H. 

b) Explique por qué C es una base para H. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Falso. Considere el conjunto {0}. 

2. Verdadero. De acuerdo con el teorema del conjunto generador, S contiene una base 
para V; llamémosla base S'. Así, T contendrá más vectores que S'. De acuerdo con el 
teorema 9, T es linealmente dependiente. 


4.6 RANGO 


Con la ayuda de los conceptos de espacio vectorial, esta sección ofrece una perspectiva des¬ 
de el interior de una matriz y revela varias relaciones interesantes y útiles, ocultas en sus filas 
y columnas. 

Por ejemplo, imagine que se colocan 2000 números aleatorios en una matriz A de 
40 x 50 y después se determina el número máximo de columnas linealmente independientes 
de A y el número máximo de columnas linealmente independientes de A T (filas de A). De 
manera sorprendente, los dos números son iguales. Como pronto veremos, su valor común 
es el rango de la matriz. Para explicar por qué, necesitamos examinar el subespacio genera¬ 
do por las filas de A. 
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El espacio fila 

Si A es una matriz de m x n. cada fila de A tiene n entradas y, por lo tanto, se puede identifi¬ 
car con un vector en IR". El conjunto de todas las combinaciones lineales de los vectores fila 
se denomina espacio fila de A y se denota como Fila A. Cada fila tiene n entradas, por lo que 
Fila A es un subespacio de R". Ya que las filas de A se identifican con las columnas de A T , 
también podríamos escribir Col A T en lugar de Fila A. 


EJEMPLO 1 Sea 

"-2 

i 


-5 

8 

0 

-17 

3 

-5 

1 

5 

11 

-19 

7 

1 

7 

-13 

5 

-3 


ri = (-2,-5, 8,0,-17) 
r 2 = (1,3,-5,1,5) 
r 3 = (3,11,-19,7,1) 
r 4 = (1,7,-13,5,-3) 


El espacio fila de A es el subespacio de R 5 generado por {r 3 , r 2 , r 3 , r 4 J. Es decir, Fila 
A = Gen {ri, r 2 , r 3 , r 4 }. Es natural representar vectores fila de forma horizontal; sin embargo, 
también es posible representarlos como vectores columna si resulta más conveniente. ■ 

Si supiéramos algo de las relaciones de dependencia lineal entre las filas de la matriz 
A del ejemplo 1, podríamos usar el teorema del conjunto generador para reducir el tamaño 
del conjunto generador a una base. Por desgracia, las operaciones de fila en A no nos dan 
esa información, porque las operaciones de fila cambian las relaciones de dependencia de 
filas. Pero la reducción de filas de A, ¡sin duda vale la pena, como muestra el siguiente 
teorema! 


TEOREMA 13 Si dos matrices Ay B son equivalentes por filas, entonces sus espacios fila son iguales. 

Si B está en forma escalonada, las filas de B diferentes de cero forman una base para el 
espacio fila de A, así como para el de B. 


DEMOSTRACIÓN Si B se obtiene a partir de A mediante operaciones de fila, las filas de B 
son combinaciones lineales de las filas de A. De ello se desprende que cualquier combina¬ 
ción lineal de las filas de B es automáticamente una combinación lineal de las filas de A. 
Así, el espacio fila de B está contenido en el espacio fila de A. Ya que las operaciones de 
fila son reversibles, el mismo argumento indica que el espacio fila de A es un subconjunto 
del espacio fila de B. De manera que los dos espacios fila son iguales. Si B está en forma 
escalonada, sus filas diferentes de cero son linealmente independientes porque ninguna fila 
diferente de cero es una combinación lineal de las filas distintas de cero debajo de esta. 
(Aplique el teorema 4 para las filas diferentes de cero de B en orden inverso, con la primera 
fila como la última). Así, las filas diferentes de cero de B forman una base del espacio fila 
(común) de B y A. ■ 

El resultado principal de esta sección implica los tres espacios: Fila A, Col A y Nul A. 
El siguiente ejemplo prepara el camino para este resultado y muestra cómo una secuencia de 
operaciones de fila de A conduce a las bases para los tres espacios. 


EJEMPLO 2 Encuentre bases para el espacio fila, el espacio columna y el espacio nulo 
de la matriz 

"-2 -5 8 0 -17" 

1 3-51 5 

A ~ 3 11 -19 7 1 

1 7 -13 5 -3 




232 CAPÍTULO 4 Espacios vectoriales 


SOLUCIÓN Para encontrar las bases para el espacio fila y el espacio columna, reduzca A 
por filas a una forma escalonada: 

13-51 5" 

0 1-2 2-7 

0 0 0 -4 20 

0 0 0 0 0 _ 

De acuerdo con el teorema 13, las tres primeras filas de B forman una base para el espacio fila 
de A (así como para el espacio fila de B). Así, 

Base para Fila A: {(1, 3, -5, 1, 5), (0, 1, -2, 2, -7), (0, 0, 0, -4, 20)} 

Para el espacio columna, observe a partir de B que los pivotes están en las columnas 1, 2 y 4. 
Por lo tanto, las columnas 1, 2 y 4 de A (no de B) forman una base para Col A: 


Base para Col A: 


Considere que cualquier forma escalonada de A proporciona (en sus filas diferentes de cero) 
una base para Fila A y también identifica las columnas pivote de A para Col A. Sin embargo, 
para Nul A, se necesita la forma escalonada reducida. Otras operaciones de fila sobre B dan 
como resultado 

10 10 1" 

01-203 
0 0 0 1 -5 
0 0 0 0 0 

La ecuación Ax = 0 es equivalente a Cx = 0, es decir, 

X\ + X3 + X5 = 0 

X2 ~ 2X3 + 3X5 = 0 

X4 — 5X5 = 0 

Así, xi = —X 3 — X 5 , X 2 = 2 x 3 — 3 x 5 , X 4 = 5xs, con x 3 y x 5 como variables libres. Los cálcu¬ 
los usuales (que se analizan en la sección 4.2) demuestran que 



Observe que, a diferencia de la base para Col A, las bases para Fila A y Nul A no tienen una 
relación sencilla con las propias entradas de A . 1 ■ 

1 Es posible encontrar una base para Fila A que utiliza filas de A. En primer lugar se determina A T , y luego se reduce 
por filas hasta que se encuentren las columnas pivote de A r . Estas columnas pivote de A T son filas de A, y forman una 
base para el espacio fila de A. 
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DEFINICIÓN 


TEOREMA 14 


Advertencia: A pesar de que las tres primeras filas de B en el ejemplo 2 son linealmente 
independientes, es erróneo concluir que las tres primeras filas de A son linealmente indepen¬ 
dientes. (De hecho, la tercera fila de A es la primera fila multiplicada por 2, más la segunda 
fila multiplicada por 7). Las operaciones de fila pueden cambiar las relaciones de dependencia 
lineal entre las filas de una matriz. 


El teorema del rango 

El siguiente teorema describe las relaciones fundamentales entre las dimensiones de Col A, 
Fila A y Nul A. 


El rango de A es la dimensión del espacio columna de A. 


Puesto que Fila A es igual que Col A T , la dimensión del espacio fila de A es el rango 
de A T . La dimensión del espacio nulo a veces se llama la nulidad de A, aunque no utilizare¬ 
mos este término. 

Tal vez un lector atento ya haya descubierto la totalidad o parte del siguiente teorema, 
mientras trabajaba con los ejercicios de la sección 4.5 o al leer el ejemplo 2 anterior. 


El teorema del rango 

Las dimensiones del espacio columna y del espacio fila de una matriz A de m x n son 
iguales. Esta dimensión común, el rango de A, también es igual al número de posiciones 
pivote en A y satisface la ecuación 

rango A + dim Nul A = n 


DEMOSTRACIÓN De acuerdo con el teorema 6 de la sección 4.3, rango A es el número de 
columnas pivote de A. De manera equivalente, rango A es el número de posiciones pivote en 
una forma escalonada B de A. Además, puesto que B tiene una fila diferente de cero para cada 
pivote, y como estas filas forman una base para el espacio fila de A, el rango de A también es 
la dimensión del espacio fila. 

A partir de la sección 4.5, la dimensión de Nul A es igual al número de variables libres en 
la ecuación Ax = 0. Dicho de otra manera, la dimensión de Nul A es el número de columnas 
de A que no son columnas pivote. (Es el número de estas columnas, no las columnas mismas, 
lo que se relaciona con Nul A). Como es evidente, 

{ número de ) ( número de columnas ( _ j número de ( 

columnas pivote ( | que no son pivote ( | columnas ( 

Esto demuestra el teorema. ■ 

Las ideas que sustentan el teorema 14 se pueden distinguir en los cálculos del ejemplo 2. 
Las tres posiciones pivote en la forma escalonada B determinan las variables básicas e iden¬ 
tifican los vectores básicos para Col A y Fila A. 


EJEMPLO 3 

a) Si A es una matriz de 7 x 9 con un espacio nulo de dimensión 2, ¿cuál es el rango de A? 

b ) ¿Podría una matriz de 6 x 9 tener un espacio nulo de dimensión 2? 
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SOLUCIÓN 

a) Puesto que A tiene 9 columnas, (rango A) + 2 = 9; por lo tanto, rango A = 7. 

b) No. Si una matriz de 6 x 9, llamémosla B , tuviera un espacio nulo de dimensión 2, tendría 

rango 7, de acuerdo con el teorema del rango. Sin embargo, las columnas de B son vec¬ 
tores en IR 6 , de manera que la dimensión de Col B no puede ser superior a 6; es decir, el 
rango de B no puede ser mayor que 6. ■ 

El siguiente ejemplo proporciona una buena forma de visualizar los subespacios que 
hemos estudiado. En el capítulo 6 se verá que Fila A y Nul A tienen solo el vector cero 
en común y, en realidad, son “perpendiculares” entre sí. Este mismo hecho se aplicará a 
Fila A t (= Col A) y Nul A 1 . Por lo tanto, la figura 1, que acompaña al ejemplo 4, crea una 
buena imagen mental para el caso general. (El valor de estudiar Adjunto con A se demues¬ 
tra en el ejercicio 29). 


EJEMPLO 4 


Sea A = 


3 

3 

4 


0 -1 
0 -1 
0 5 


Se comprueba rápidamente que Nul A es el 


eje X2, Fila A es el plano X1X3, Col A es el plano cuya ecuación es X\ — xn = 0, y Nul A 1 es 
el conjunto de todos los múltiplos de (1, —1, 0). La figura 1 muestra Nul A y Fila A en el 
dominio de la transformación lineal x »Ax; el rango de este mapeo. Col A, se muestra en 
una copia separada de R 3 , junto con Nul A r . ■ 



FIGURA 1 Subespacios determinados por una 
matriz A. 


Aplicaciones para sistemas de ecuaciones 

El teorema del rango es una poderosa herramienta para el procesamiento de información 
sobre los sistemas de ecuaciones lineales. El siguiente ejemplo simula la forma como se 
plantearía un problema de la vida real utilizando ecuaciones lineales, sin mencionar explíci¬ 
tamente términos de álgebra lineal, como matriz, subespacio y dimensión. 

EJEMPLO 5 Un científico encontró dos soluciones para un sistema homogéneo de 40 
ecuaciones con 42 variables. No son múltiplos las dos soluciones, y todas las demás solucio¬ 
nes se pueden desarrollar sumando múltiplos adecuados de estas dos soluciones. ¿Puede el 
científico estar seguro de que un sistema no homogéneo asociado (con los mismos coeficien¬ 
tes) tiene una solución? 

SOLUCIÓN Sí. Sea A una matriz de coeficientes de 40 x 42 del sistema. La información 
dada implica que las dos soluciones son linealmente independientes y generan Nul A. Así que 
dim Nul A = 2. De acuerdo con el teorema del rango, dim Col A = 42 — 2 = 40. Como R 40 
es el único subespacio de R 40 cuya dimensión es 40, Col A debe ser todo de R 40 . Esto signi¬ 
fica que cada ecuación no homogénea Ax = b tiene una solución. ■ 
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El rango y el teorema de la matriz invertible 

Los distintos conceptos de espacios vectoriales asociados a una matriz proporcionan varios 
enunciados adicionales al teorema de la matriz invertible. Los nuevos enunciados que se listan 
a continuación se deducen del teorema de la matriz invertible original de la sección 2.3. 


El teorema de la matriz invertible (continuación) 

Sea A una matriz de n x n. Cada uno de los siguientes enunciados es equivalente a la 
afirmación de que A es una matriz invertible. 

m ) Las columnas de A forman una base de IR". 

n) Col A = R" 

o) dim Col A = n 

p) rango A = n 

q) NulA = {0} 

r) dim Nul A = 0 


DEMOSTRACIÓN El enunciado m) es lógicamente equivalente a los enunciados e) y h) 
en relación con la independencia lineal y la generación. Los otros cinco enunciados están 
vinculados a los anteriores del teorema mediante la siguiente cadena de implicaciones casi 
triviales: 


8 ) => n) ^ o) ^p)^r)^q)^d) 

El enunciado g), el cual dice que la ecuación Ax = b tiene al menos una solución para cada b 
en R", implica a n), porque Col A es precisamente el conjunto de todas las b tales que la 
ecuación Ax = b es consistente. Las implicaciones n) => o) => p) se deducen de las defini¬ 
ciones de dimensión y rango. Si el rango de A es n, el número de columnas de A, enton¬ 
ces dim Nul A = 0, de acuerdo con el teorema del rango, y Nul A = (0). Por lo tanto, 
p) => r) => q). Además, q) implica que la ecuación Ax = 0 tiene solamente la solución tri¬ 
vial, que es el enunciado d ). Como ya se sabe que los enunciados d) y g) son equivalentes al 
enunciado de que A es invertible, la demostración está completa. ■ 

Nos hemos abstenido de agregar al teorema de la matriz invertible enunciados evidentes 
acerca del espacio fila de A, ya que el espacio fila es el espacio columna de A T . Recuerde el 
enunciado (1) del teorema de la matriz invertible, el cual afirma que A es invertible si y solo 
si A T es invertible. Por lo tanto, cada enunciado en el teorema de la matriz invertible también 
se puede establecer respecto de A T . Pero hacer esto duplicaría la longitud del teorema y se 
obtendría una lista ¡de más de 30 enunciados! 
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Muchos algoritmos analizados en este libro son útiles para comprender conceptos y 
efectuar cálculos sencillos a mano. Sin embargo, los algoritmos a menudo son inade¬ 
cuados para los grandes problemas que surgen en la vida real. 

La determinación de un rango es un buen ejemplo. Tal vez parezca fácil reducir 
una matriz a la forma escalonada y contar los pivotes. Pero, a menos que se realice 
aritmética exacta en una matriz cuyas entradas se especifiquen con exactitud, las opera¬ 
ciones de fila pueden cambiar el rango aparente de una matriz. Por ejemplo, si el valor 


de x en la matriz 


5 

5 


7 

x 


no se almacena exactamente como 7 en una computadora. 


entonces el rango podría ser 1 o 2, dependiendo de si la computadora trata o no a 
x — 7 como cero. 

En las aplicaciones prácticas, el rango efectivo de una matriz A con frecuencia se 
determina a partir de la descomposición en valores singulares de A, que se analizará 
en la sección 7.4. Esta descomposición también es una fuente confiable de bases para 
Col A, Fila A, Nul A y Nul A T . 


PROBLEMAS DE PRÁCTICA 

Las matrices que se muestran a continuación son equivalentes por filas. 


2 

-1 

1 

-6 

8 


" 1 

-2 

-4 

3 

-2" 

1 

-2 

-4 

3 

-2 

B = 

0 

3 

9 

-12 

12 

-7 

8 

10 

3 

-10 

0 

0 

0 

0 

0 

4 

-5 

-7 

0 

4 


0 

0 

0 

0 

0 


1. Determine rango A y dim Nul A. 

2. Encuentre bases para Col A y Fila A. 

3. ¿Cuál es el siguiente paso a realizar con la finalidad de encontrar una base para Nul A? 

4. ¿Cuántas columnas pivote están en una forma escalonada por filas de A 7 ? 


4.6 EJERCICIOS 


En los ejercicios 1 a 4, suponga que la matriz A es equivalente por 
filas a B. Sin hacer cálculos, liste rango de A y dim Nul A. Luego, 
encuentre las bases para Col A, Fila A y Nul A. 


1. A = 


B = 


3. A = 


2. A = 


B = 


2 6 
-2 -3 


-6 6 
6 -3 


9 -12 


3 6 

0 -6 
3 12 









_ —2 

3 


6 

3 3 


_ 

1 

-4 


9 - 

7' 









-1 

2 


-4 

1 



'2 

6 

-6 

6 

3 

6 





10 




0 

3 

0 

3 

3 

0 


5 

-6 


7 


B = 






0 

-1 




0 

0 

0 

0 

3 

0 


' 1 

5 




0 

0 

0 

0 

0 


0 

0 

-2 

5 

-6 










0 

0 

0 

0 _ 




" 1 

1 

-2 

0 

1 - 

-2" 









1 

2 

-3 

0 

-2 - 

-3 


' 1 

3 

4 

-1 

21 

4 - 

II 

1 

-1 

0 

0 

1 

6 


2 

6 

6 

0 




1 

-2 

2 

1 

-3 

0 


3 

9 

3 

6 

-. 


’ 

_ 1 

-2 

1 

0 

2 - 

-1 _ 


_ 3 

9 

0 

9 

oj 


' 1 

1 

-2 

0 

1 

-2 

1 

' 1 

3 

4 

-1 


2“ 


0 

1 

-1 

0 

-3 

-1 

0 

0 

1 

-1 


1 

B = 

0 

0 

1 

1 

-13 

-1 

0 

0 

0 

0 

- 

5 


0 

0 

0 

0 

1 

-1 

0 

0 

0 

0 

0 


0 

0 

0 

0 

0 

1 
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5. Si una matriz A de 4 x 7 tiene rango 3, determine dim Nul A, 
dim Fila A y el rango de A T . 

6. Si una matriz A de 7 x 5 tiene rango 2, determine dim Nul A, 
dim Fila A y el rango de A T . 

7. Suponga que una matriz A de 4 x 7 tiene cuatro columnas 
pivote. ¿Es Col A = IR 4 ? ¿Es Nul A = IR 3 ? Explique sus 
respuestas. 

8. Supongamos que una matriz A de 6 x 8 tiene cuatro columnas 
pivote. ¿Cuál es la dim Nul A? ¿Es Col A = IR 4 ? ¿Por qué? 

9. Si el espacio nulo de una matriz A de 4 x 6 es de dimensión 3, 
¿cuál es la dimensión del espacio columna de A? ¿Es Col A = 
IR 3 ? ¿Por qué? 

10. Si el espacio nulo de una matriz A de 8 x 7 es de dimensión 5, 
¿cuál es la dimensión del espacio columna de A? 

11. Si el espacio nulo de una matriz A de 8 x 5 es de dimensión 3, 
¿cuál es la dimensión del espacio fila de A? 

12. Si el espacio nulo de una matriz A de 5 x 4 es de dimensión 2, 
¿cuál es la dimensión del espacio fila de A? 

13. Si A es una matriz de 7x5, ¿cuál es el mayor rango posible 
de A? Si A es una matriz de 5 x 7, ¿cuál es el mayor rango posi¬ 
ble de A? Explique sus respuestas. 

14. Si A es una matriz de 5 x 4, ¿cuál es la mayor dimensión posible 
del espacio fila de A? Si A es una matriz de 4 x 5, ¿cuál es la 
máxima dimensión posible del espacio fila de A? Explique sus 
respuestas. 

15. Si A es una matriz de 3 x 7, ¿cuál es la menor dimensión posible 
de Nul A? 

16. Si A es una matriz de 7 x 5, ¿cuál es la menor dimensión posi¬ 
ble de Nul A? 

En los ejercicios 17 y 18, A es una matriz de m x n. Marque cada 
enunciado como verdadero o falso. Justifique sus respuestas. 

17. a ) El espacio fila de A es el mismo que el espacio columna 

de A T . 

tí) Si B es cualquier forma escalonada de A, y si B tiene tres 
filas diferentes de cero, entonces las tres primeras filas de 
A forman una base para Fila A. 

c) Las dimensiones del espacio fila y el espacio columna de A 
son iguales, incluso si A no es cuadrada. 

d ) La suma de las dimensiones del espacio fila y el espacio nulo 
de A es igual al número de filas en A. 

e) En una computadora, las operaciones de fila pueden modi¬ 
ficar el rango aparente de una matriz. 

18. a) Si B es cualquier forma escalonada de A, entonces las co¬ 

lumnas pivote de B forman una base para el espacio columna 
de A. 

b ) Las operaciones de fila preservan las relaciones de depen¬ 
dencia lineal entre las filas de A. 

c) La dimensión del espacio nulo de A es el número de colum¬ 
nas de A que no son columnas pivote. 

d) El espacio fila de A T es igual que el espacio columna de A. 


e) Si A y B son equivalentes por filas, entonces sus espacios fila 
son iguales. 

19. Suponga que todas las soluciones de un sistema homogéneo de 
cinco ecuaciones lineales con seis incógnitas son múltiplos 
de una solución diferente de cero. ¿El sistema necesariamente 
tendrá una solución para cada posible elección de las constantes 
en el lado derecho de las ecuaciones? Explique su respuesta. 

20. Suponga que un sistema no homogéneo de seis ecuaciones li¬ 
neales con ocho incógnitas tiene una solución, con dos variables 
libres. ¿Es posible cambiar algunas constantes en los miembros 
derechos de las ecuaciones para hacer que el nuevo sistema sea 
inconsistente? Explique su respuesta. 

21. Suponga que un sistema no homogéneo de nueve ecuaciones 
lineales con 10 incógnitas tiene una solución para todas las po¬ 
sibles constantes de los miembros derechos de las ecuacio¬ 
nes. ¿Es posible encontrar dos soluciones diferentes de cero 
del sistema homogéneo asociado que no sean múltiplos una de 
la otra? Analice. 

22. ¿Es posible que todas las soluciones de un sistema homogéneo 
de 10 ecuaciones lineales con 12 variables sean múltiplos de 
una solución fija diferente de cero? Analice. 

23. Un sistema homogéneo de 12 ecuaciones lineales con ocho in¬ 
cógnitas tiene dos soluciones fijas que no son múltiplos una de 
la otra, y todas las demás soluciones son combinaciones lineales 
de estas dos soluciones. ¿Puede describirse el conjunto de todas 
las soluciones con menos de 12 ecuaciones lineales homogé¬ 
neas? Si es así, ¿con cuántas? Analice. 

24. ¿Es posible que un sistema no homogéneo de siete ecuaciones 
con seis incógnitas tenga una solución única para algún con¬ 
junto de constantes del miembro derecho? ¿Es posible que este 
sistema tenga una solución única para cada miembro derecho? 
Explique sus respuestas. 

25. Un científico resuelve un sistema no homogéneo de 10 ecua¬ 
ciones lineales con 12 incógnitas y encuentra que tres de las 
incógnitas son variables libres. ¿Puede el científico estar seguro 
de que, si se cambia el lado derecho de las ecuaciones, el nuevo 
sistema no homogéneo tendrá una solución? Analice. 

26. En teoría estadística, un requisito común es que una matriz sea 
de rango completo. Es decir, el rango debe ser tan grande como 
sea posible. Explique por qué una matriz de m x n con más filas 
que columnas tiene rango completo si y solo si sus columnas 
son linealmente independientes. 

Los ejercicios 27 a 29 se refieren a una matriz A de m x n y a lo que 

con frecuencia se denomina los subespacios fundamentales deter¬ 
minados por A. 

27. ¿Cuál de los subespacios Fila A, Col A, Nul A, Fila A T , Col A r 
y Nul A T están en IR'" y cuáles están en IR"? ¿Cuántos subespa¬ 
cios distintos están en esta lista? 

28. Justifique las siguientes igualdades: 

a) dim Fila A + dim Nul A = n Número de columnas de A 
tí) dim Col A + dim Nul A r = m Número de filas de A 

29. Con base en el ejercicio 28, explique por qué la ecuación 
Ax = b tiene una solución para toda b en IR"' si y solo si la ecua¬ 
ción A r x = 0 tiene solamente la solución trivial. 
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30. Suponga que A es m x n y b está en IR"'. ¿Qué tiene que ser 
verdad acerca del rango de [A b] y el rango A para que la ecua¬ 
ción Ax — b sea coherente? 

Las matrices con rango 1 son importantes en algunos algoritmos 
de computadora y varios contextos teóricos, incluyendo la des¬ 
composición en valores singulares del capítulo 7. Es posible demos¬ 
trar que una matriz A de m x n tiene rango 1 si y solo si se trata 
de un producto externo, es decir, A = uv r por alguna u en IR'" y 
v en IR". Los ejercicios 31 a 33 sugieren por qué esta propiedad 
es verdadera. 



2“ 


a 

31. Compruebe que el rango de uv r S 1 si u = 

-3 

y u = 

b 


5 


c 


32. 


Sea u = 


1 

2 


. Encuentre v en IR 3 tal que 


1 -3 4 
2-6 8 


33. Sea A cualquier matriz de 2 x 3 tal que rango A = 1 . Sea u 
la primera columna de A, y suponga que u =£ 0. Explique 
por qué hay un vector v en IR 3 tal que A = uv r . ¿Cómo po¬ 
dría modificarse esta construcción si la primera columna de A 
fuera cero? 


34. Sea A una matriz de m x n de rango r > 0, y sea U una forma 
escalonada de A. Explique por qué existe una matriz invertible 
E tal que A = EU, y utilice esta factorización para escribir A 
como la suma de r matrices con rango 1. [ Sugerencia : Véase el 
teorema 10 de la sección 2.4], 


7 

-9 

-4 

5 

3 

-3 

-7 

-4 

6 

7 

-2 

-6 

-5 

5 

5 

-7 

-6 

5 

-6 

2 

8 

-3 

5 

8 

-1 

-7 

-4 

8 

6 

-8 

-5 

4 

4 

9 

3 


a) Construya matrices C y N, cuyas columnas son las bases 
para Col A y Nul A, respectivamente, y construya una matriz 
R cuyas filas formen una base para Fila A. 

b) Construya una matriz M cuyas columnas formen una 
base para Nul A T , construya las matrices S = [R r V] y 
T = [C Ai], y explique por qué S y T deberían ser cua¬ 
dradas. Compruebe que tanto 5 como T son invertibles. 


36. [M] Repita el ejercicio 35 para una matriz aleatoria A de 
6x7 con valores enteros y rango de 4 o menor. Una manera 
de construir A es crear una matriz aleatoria J de 6 x 4 con 
valores enteros y una matriz aleatoria K de 4 x 7 con valores 
enteros, y establecer que A = JK. (Véase el ejercicio comple¬ 
mentario 12 al final del capítulo; véase también la Guía de estu¬ 
dio para los programas de generación de matrices). 

37. [M] Sea A la matriz del ejercicio 35. Construya una matriz C 
cuyas columnas sean las columnas pivote de A, y construya una 
matriz R cuyas filas sean las filas diferentes de cero de la forma 
escalonada reducida de A. Calcule CR , y analice sus hallazgos. 

38. [M] Repita el ejercicio 37 para tres matrices aleatorias A de 
5x7 con valores enteros y rangos de 5, 4 y 3. Haga una con¬ 
jetura acerca de cómo se relaciona CR con A para cualquier 
matriz A. Demuestre su suposición. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. A tiene dos columnas pivote, por lo que rango A = 2. Puesto que A tiene 5 columnas en 
total, dim Nul A = 5 — 2 = 3. 

2. Las columnas pivote de A son las dos primeras columnas. Por lo tanto, una base para 
Col A es 


{ai,a 2 } 



Las filas diferentes de cero de B forman una base para Fila A, a saber, {(1, —2, —4, 
3, —2), (0, 3, 9, —12, 12)}. En este ejemplo en particular, resulta que dos filas cuales¬ 
quiera de A forman una base para el espacio fila, ya que el espacio fila es de dimensión 
2 y ninguna de las filas de A es un múltiplo de otra fila. En general, las filas diferentes 
de cero de una forma escalonada de A se deberían utilizar como base para Fila A, y no 
las filas de A. 

3. Para Nul A, el siguiente paso es llevar a cabo operaciones de fila en B para obtener la 
forma escalonada reducida de A. 

4. Rango A T = rango A, de acuerdo con el teorema del rango, ya que Col A T = Fila A. 
De manera que A T tiene dos posiciones pivote. 
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4.7 CAMBIO DE BASE 

Cuando se elige una base B para un espacio vectorial V de dimensión n, el mapeo de coorde¬ 
nadas asociado a IR" proporciona un sistema de coordenadas para V. Se identifica cada x en V 
únicamente por su vector de £>-coordenadas, [ x ] B . 1 

En algunas aplicaciones, se describe un problema inicialmente usando una base B , pero 
la solución del problema se facilita cambiando B a una nueva base C. (Se darán ejemplos en 
los capítulos 5 y 7). A cada vector se le asigna un nuevo vector de C-coordenadas. En esta 
sección se estudia cómo [ x ] c y [ x ] g se relacionan para toda x en V. 

Para visualizar el problema, considere los dos sistemas de coordenadas de la figura 1. En 
la figura leí), x = 3b! + h 2 , mientras que en la figura Ib), la misma x se muestra como x = 
6ci + 4 c 2 . Es decir, 

r ! [3] , , [6 

[x] H =|^iJ y [x] c = |^ 4 

Nuestro problema es encontrar la conexión entre los dos vectores de coordenadas. El ejem¬ 
plo 1 muestra cómo hacer esto, siempre que se conozca cómo se forman bi y b 2 a partir 
de ci y C 2 - 


FIGURA 1 Dos sistemas de coordenadas para el mismo espacio vectorial. 


EJEMPLO 1 Considere dos bases B = {bi,b 2 } y C = {ci,C 2 } de un espacio vectorial 
V, de manera que 


b! = 4c i + c 2 y 

b 2 = — 6ci + c 2 

(1) 

Suponga que 



x = 3bi 

+ b2 

(2) 

[31 

Es decir, suponga que [ x ] g = . Encuentre 

[x] c . 



SOLUCION Aplique el mapeo de coordenadas determinado por C a x en la ecuación (2). 
Puesto que el mapeo de coordenadas es una transformación lineal, 

[x] c = [3bi +b 2 ] c 
= 3[bi ] c + [b 2 ] c 

Podemos escribir esta ecuación vectorial como una ecuación matricial, utilizando los vectores 
en la combinación lineal como las columnas de una matriz: 

[x] c = [[b! ] c [b 2 ] c ] j (3) 

1 Piense en [ x como un “nombre” de x que lista los pesos utilizados para construir x como una combinación lineal 
de los vectores básicos en B. 
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Esta fórmula da [ x ] c , una vez que se conocen las columnas de la matriz. A partir de (1), 


ib, L = 


y [b 2 ] r = 


Por lo tanto, la ecuación (3) da la solución: 


'4 -6' 

'3' 


reí 

1 1 

1 


1 


Las C-coordenadas de x coinciden con las de x en la figura 1. ■ 


El argumento que se utiliza para deducir la fórmula (3) se puede generalizar para obtener 
el siguiente resultado. (Véase los ejercicios 15 y 16). 


TEOREMA 15 


Sean B = { bj,..., b„} y C = { Ci,_, c,¡} las bases de un espacio vectorial V. Entonces, 

existe una única matriz P de n x n tal que 

C-<—B H 



(4) 


Las columnas de P ^ son los vectores de C-coordenadas de los vectores en la base B. 
Es decir. 


cZ B = [^c M c - IMj (5) 


La matriz P en el teorema 15 se denomina matriz de cambio de coordenadas de B 

C^B 

a C. La multiplicación por P^ convierte a las ^-coordenadas en las C-coordenadas. 2 
La figura 2 ilustra la ecuación de cambio de coordenadas (4). 



FIGURA 2 Dos sistemas de coordenadas para V. 


Las columnas de P& son linealmente independientes porque son los vectores de coor¬ 
denadas del conjunto linealmente independiente B. (Véase el ejercicio 25 de la sección 4.4). 
Puesto que P es cuadrada, debe ser invertible, de acuerdo con el teorema de la matriz 

invertible. Multiplicando por la izquierda ambos lados de la ecuación (4) por ( c ^’ r ) _1 se 
obtiene 


{cZb)~ 1 [*\c = [ x 1 B 


2 Para recordar cómo se construye la matriz, piense en [ x ]¿3 como en una com binación lineal de las colum¬ 
nas de P . El producto matriz-vector es un vector de C-coordenadas, de modo que las columnas de P 
C-^—B F H C-^—B 

también deberían ser los vectores de C-coordenadas. 
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Por lo tanto, (c^g) 1 es la matriz que convierte las ^-coordenadas en C-coordenadas. 
Es decir, 

(c-£b) 1 = C¿B ( 6 ) 


Cambio de base en U n 

Si B = {bj,..., b,¡} y £ es la base estándar {ei,_, e„} en R", entonces [bi]¿r = bi, y lo mismo 

para los otros vectores en B. En este caso, £ P_ B es igual a la matriz de cambio de coordenadas 
Pg que se presentó en la sección 4.4, a saber, 

Pb=[ bi b 2 ••• b„] 

Para cambiar las coordenadas entre dos bases que no son estándar en R", se necesita el 
teorema 15. El teorema demuestra que para resolver el problema de cambio de base, se nece¬ 
sitan los vectores de coordenadas de la antigua base respecto de la nueva base. 


EJEMPLO 2 Sean bi = 

las bases de R 2 dadas por B 
coordenadas de B a C. 


'-9' 


'-5' 


r r 


3' 


1 

, b 2 = 

-1 

, Cl = 

-4 

, c 2 = 

-5 

, y considere 


{bi, b 2 ¡ y C = { Ci, c 2 }. Encuentre la matriz de cambio de 


SOLUCIÓN La matriz C H B implica a los vectores de C-coordenadas de bi y b 2 . 

T v, 1 

Sean [ bi L 


Xl 

x2 


y [b 2 ] c = 

[ Cl c 2 ] 


y i 
y 2 


x¡ 

X2 


. Así, por definición, 
= bi y [ci c 2 ] 


y\ 

yi 


b 2 


Para resolver ambos sistemas simultáneamente, se aumenta la matriz de coeficientes con bi 
y b 2 , y se reduce por filas: 


[c, c 2 ■ bi b 2 ] = 


r i 3: 

-9 

-5' 


' 1 

0 

6 

4" 

1 

'Tf 

1 

_ 1 

1 

-1 


0 

1 

-5 

-3 


(7) 


Así, 


6 

-5 


4 

-3 


y [b 2 ] c = 

La matriz del cambio de coordenadas deseada es, por consiguiente 


= [tb.lc [ «>2 ] c ] = 


C<—B 


6 4 

-5 -3 


Observe que la matriz £ P_ B del ejemplo 2 ya apareció en la ecuación (7). Esto no es 
sorprendente, ya que la primera columna de c P_ B resulta de reducir por filas [ci c 2 j bi] a 
[I i I b| ] (1 ], y de manera similar para la segunda columna de C J1 B - Por lo tanto, 

[ ci c 2 bi b 2 ] ~ [ / I c l B ] 


Un procedimiento análogo funciona para encontrar la matriz de cambio de coordenadas entre 
dos bases cualesquiera en R". 






242 CAPÍTULO 4 Espacios vectoriales 


1 —2 —7 —5 

EJEMPLO 3 Seab 1= , b 2 = “ , Ci = M, c 2 = 7 I, y considere las 

bases para IR 2 dadas por B = {bi, b 2 } y C = { c 2 , c 2 }. 

a) Determine la matriz de cambio de coordenadas de C a 13. 

b) Encuentre la matriz de cambio de coordenadas de B a C. 

SOLUCIÓN 

a) Considere que gP_ c se necesita más que C ¿ B - y calcule 



b) De acuerdo con el inciso a) y la propiedad (6) anterior (con B y C, intercambiadas). 



Otra descripción de la matriz de cambio de coordenadas C J^_ B utiliza las matrices de 
cambio de coordenadas Pjg y Pe que convierten a las coordenadas By C, respectivamente, en 
coordenadas estándar. Recuerde que para cada x en R", 

P¡ 3 [x \¡3 = x, P c [x] c = x y [x] c = P B x x 

Por lo tanto. 

Me = Pc l x = Pc X Pb[x]b 

En R", la matriz de cambio de coordenadas ( , P& se puede calcular como P B l P&. En realidad, 
para matrices más grandes que 2x2, un algoritmo similar al del ejemplo 3 es más rápido que 
calcular P c 1 y luego P B X Pg. Véase el ejercicio 12 en la sección 2.2. 

PROBLEMAS DE PRÁCTICA 

1. Sean T = {fi, f 2 ¡ y Q = (gi, g 2 } bases para un espacio vectorial V, y sea P una ma¬ 
triz cuyas columnas son [fi]p y [f 2 ]p. ¿Cuál de las siguientes ecuaciones satisface P para 
toda v en V? 

i. [vjjr = P[y] g ii. [v]<j = P[v]r 

2. Sean By C como en el ejemplo 1. Utilice los resultados de ese ejemplo para encontrar la 
matriz de cambio de coordenadas de C a B. 


4.7 EJERCICIOS 

1. Sean B = {bi, b 2 J y C = {ci, c 2 } bases para un espacio vecto¬ 
rial V y suponga que bi = 6ci — 2c 2 y b 2 = 9ci — 4c 2 . 

a) Encuentre la matriz de cambio de coordenadas de B a C. 

b) Encuentre [x]¿ para x = —3bi + 2b 2 . Utilice el inciso a). 


2. Sean B = {bi, b 2 ¡ y C — {ci, c 2 J bases para un espacio vecto¬ 
rial V, y suponga que bi = — 2ci + 4c 2 y b 2 = 3ci — 6c 2 . 

a) Encuentre la matriz de cambio de coordenadas de B a C. 

b) Determine [x]¿ para x = 2bi + 3b 2 . 
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3. Sean U = {ui, u 2 ) y W = {wi, W 2 } bases para V, y sea P una 
matriz cuyas columnas son [ u 1 ] >v y [uylyy. ¿Cuál de las si¬ 
guientes ecuaciones satisface P para toda x en VI 

i. [x] w = / J [x] w ii. \x] w =P\x\ u 

4. Sean A = {ai, ai, 83 } y V = {di, do, d 3 ¡ bases para V, y sea 
/'[[di] 4 [do]^ [di] ( ]. ¿Cuál de las siguientes ecuaciones sa¬ 
tisface P para toda x en V? 

i. [x]^ = P|x], D ii. [x]p = P[x) A 

5. Sean A = {ai, a2, 83} y B = {bi, b2, b3} bases para un espacio 
vectorial V, y suponga que ai = 4bi — b2, a2 = — bi + b2 + b3, 
y a 3 = b 2 — 2b 3 . 

a) Encuentre la matriz de cambio de coordenadas de A a B. 

b ) Determine [x] g para x = 3ai + 4 a 2 + 83 . 

6. Sean T> = {di. do, d 3 } y T = {fi, Í 2 , f 3 } bases para un espacio 
vectorial V, y suponga que = 2di — d 2 + di, f 2 = 3d2 + d 3 , 
y L = —3di + 2d3. 

a) Encuentre la matriz de cambio de las coordenadas de ^a 22. 
tí) Determine [x] p para x = fi — 2fo + 2 Í 3 . 


Los ejercicios 15 y 16 brindan una demostración del teorema 15. 
Complete la justificación para cada paso. 

15. Dada v en V, existen escalares X\,..., x,„ tales que 
V = A'ibl + X 2 b 2 + • • • + x n b„ 


porque a) _. Aplique el mapeo de coordenadas determi¬ 

nado por la base C, y obtenga 


[v] c = jci[bi] c + x 2 (b 2 | c + •■• + A„[b„] c 

porque tí) _. Esta ecuación se puede escribir en la forma 


[v] c = [[bi] c [b 2 ] c 



( 8 ) 


de acuerdo con la definición de c) _ . Esto indica que 

la matriz C J^ B que se muestra en la ecuación (5) satisface 
[v] c = c l B M B para toda v en V, porque el vector del lado 
derecho en ( 8 ) es d) _. 


En los ejercicios 7 a 10, sean B = {bi, b 2 j y C— {ci, C 2 } bases para 
IR 2 . En cada ejercicio, encuentre la matriz de cambio de coordenadas 
de B a C y la matriz de cambio de coordenadas de C a B. 


7. b, 

8. b[ 

9. b! 

10. b, 



En los ejercicios 11 y 12, B y C son bases para un espacio vecto¬ 
rial V. Marque cada enunciado como verdadero o falso. Justifique 
sus respuestas. 

11. a) Las columnas de la matriz de cambio de coordenadas C J > _ B 

son vectores de 25-coordenadas de los vectores en C. 

b ) Si V = IR", y C es la base estándar para V, entonces C J^ B es 
igual a la matriz de cambio de coordenadas P B que se pre¬ 
sentó en la sección 4.4. 

12. a) Las columnas de C £_ B son linealmente independientes. 

tí) Si V = IR 2 , B = {bi, b 2 } y C = {Ci, C 2 }, entonces la re¬ 
ducción por filas de [cj C 2 bi b 2 ] a [I P] produce una 
matriz P que satisface [x] e = T 3 [x] para toda x en V. 

13. En P 2 , encuentre la matriz de cambio de coordenadas de la base 
B = {1 — 2t + t 2 , 3 — 5? + 4í 2 , 2 1 + 3f 2 } a la base estándar 
de C = {1, t, t 2 }. Luego, encuentre el vector de 8-coordenadas 
para — 1 + 2r. 

14. En IP 2 , encuentre la matriz de cambio de coordenadas de la 
base B = {1 — 3t 2 , 2 + t — 51 2 , 1 + 2t} a la base estándar. 
Luego, escriba t 2 como una combinación lineal de los polino¬ 
mios en B. 


16. Suponga que Q es cualquier matriz de manera que 

[' , ] c = <2 M b para toda v en V (9) 

Establezca v = bi en la ecuación (9). Después (9) indica que 
[bi] c es la primera columna de Q porque a) _. De ma¬ 

nera similar, para k = 2,..., n, la 2r-ésima columna de Q es 
b) _porque c) _. Esto indica que la matriz C ^_ B defi¬ 

nida por (5) en el teorema 15 es la única matriz que satisface la 
condición (4). 

17. [M] Sea B — {x 0 ,..., x 6 } y C — {yo,---, yó), donde x k es la 
función cos^ t y y* es la función eos kt. El ejercicio 34 de 
la sección 4.5 mostró que tanto B como C son bases para el 
espacio vectorial H = Gen {xo,..., xgj. 

a) Sea P = [ [ y 0 ] B • • • [ y 6 ] B ], y calcule P 1 . 

b) Explique por qué las columnas de P~ l son los vectores de 
C-coordenadas de Xq, ..., xg. Después, utilice estos vectores 
de coordenadas para escribir identidades trigonométricas 
que expresen potencias de eos t en términos de las funciones 
en C. 

18. [M] (Se requiere cálculo ) 3 Recuerde de sus clases de cálculo 
que las integrales como 

y (5 eos 3 1 — 6 eos 4 1 + 5 eos 5 t — 12 eos 6 1) dt (10) 

son tediosas de calcular. (El método habitual es aplicar inte¬ 
gración por partes varias veces y usar la fórmula de la mitad del 
ángulo). Utilice la matriz P o P~ l del ejercicio 17 para trans¬ 
formar (10), y después calcule la integral. 


3 La idea de los ejercicios 17 y 18 y cinco ejercicios relacionados en las sec¬ 
ciones anteriores provienen de un documento de Jack W. Rogers, Jr., de la 
Universidad de Aubum, presentado en una reunión de la International Linear 
Algebra Society, en agosto de 1995. Véase la sección “Applications of Li¬ 
near Algebra in Calculus”, American Mathematical Monthly 104 (1), 1997. 
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19. [M] Sea 



a) Encuentre una base [ui, 112 . 113 } para IR 3 tal que P es la 
matriz de cambio de coordenadas de {ui, U 2 , 113 } a la base 
¡Vi, V2, V3 }. [Sugerencia: Pregúntese qué representan las 
columnas de ]. 


b) Encuentre una base {wi, W 2 , W 3 } para IR 3 tal que P es la 
matriz de cambio de coordenadas de ¡vi, V 2 , V 3 } a ¡Wi, W 2 , 
w 3 ). 

20. Sean B = {bi, b 2 } . C = {ci, C 2 } y T> = {di, d 2 ¡ y bases para 
un espacio vectorial de dimensión 2 . 

a) Escriba una ecuación que relacione las matrices C J^ B , T¡ ¿. c 
y 0 r'g. Justifique su resultado. 

b) [M] Utilice un programa de matrices ya sea para ayudar¬ 
le a encontrar la ecuación o para comprobar la ecuación 
que escribió. Trabaje con tres bases de IR 2 . (Véase los ejer¬ 
cicios 7 a 10). 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Como las columnas de P son vectores de coordenadas Q , un vector de la forma Px debe 
ser un vector de coordenadas Q. Por lo tanto, P satisface la ecuación ii. 

2. Los vectores de coordenadas que se encuentran en el ejemplo 1 indican que 


P = [ [ b i 


C<—B 


i b 2] c ; = 


Por lo tanto, 


P _ ( P \-i _ J1 

yC<-B> — 1 n 


B^-C 


1 

10 


1 

6 ' 


.1 

. 6 ' 

-1 

4 


-.1 

.4 


4.8^ APLICACIONES A LAS ECUACIONES EN DIFERENCIAS 

Ahora que se dispone de poderosas computadoras, cada vez más problemas científicos y de 
ingeniería se analizan utilizando datos discretos, o digitales, en lugar de datos continuos. 
Las ecuaciones en diferencias con frecuencia son la herramienta adecuada para analizar 
esos datos. Incluso cuando una ecuación diferencial se utiliza para modelar un proceso con¬ 
tinuo, a menudo se obtiene una solución numérica a partir de una ecuación en diferencias 
relacionada. 

En esta sección se ponen de relieve algunas propiedades fundamentales de las ecuaciones 
en diferencias lineales que se explican mejor utilizando el álgebra lineal. 

Señales discretas de tiempo 

El espacio vectorial S de las señales discretas de tiempo se presentó en la sección 4.1. 
Una señal en S es una función definida solo con números enteros y se visualiza como una 
secuencia de números, por ejemplo, {y¿}. La figura 1 muestra tres señales típicas cuyos tér¬ 
minos generales son 1 k y (- -1 ) k , respectivamente. 


y k = .7 k y k =l k y k =(-D k 



I T i T 





2 -1 

10 12 

-2-1 0 1 2 

-2 

0 

2 


FIGURA 1 Tres señales en S. 
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Las señales digitales, desde luego, surgen en ingeniería de sistemas eléctricos y de con¬ 
trol, pero secuencias de datos discretos también se generan en biología, física, economía, 
demografía y muchas otras áreas, donde se mide un proceso, o se muestrea, en intervalos 
discretos de tiempo. Cuando se inicia un proceso en un momento específico, a veces es con¬ 
veniente representar una señal como una secuencia de la forma (yo, y i, y 2 , ■ ■ ■)• Se supone que 
los términos para k < 0 son cero o simplemente se omiten. 

EJEMPLO 1 El sonido cristalino de un reproductor de discos compactos proviene de 
música de la que se han tomado muestras a una velocidad de 44,100 veces por segundo. Véase 
la figura 2. En cada medición, la amplitud de la señal de música se registra como un número, 
por ejemplo, y¿. La música original está compuesta de muchos sonidos diferentes de diversas 
frecuencias; sin embargo, la secuencia ¡y*} contiene suficiente información para reproducir 
todas las frecuencias en el sonido hasta aproximadamente 20,000 ciclos por segundo, más allá 
de lo que el oído humano puede percibir. ■ 


y 



de música. 


Independencia lineal en el espacio § de las señales 

Para simplificar la notación, consideramos un conjunto de solo tres señales en S, por ejemplo, 
{uk}, {v/.} y {wjt¡. Son linealmente independientes precisamente cuando la ecuación 


c\Uk + C 2 Vk + C 3 Wk = 0 para toda k 


O) 


implica que Ci = C 2 = C 3 = 0. La frase “para toda k” significa para todos los enteros: positi¬ 
vos, negativos y cero. También se podría considerar que las señales comienzan con k = 0, por 
ejemplo; en tal caso, “para toda k” significaría para todos los enteros mayores que o iguales 
a cero (k > 0 ). 

Suponga que ci, C 2 , C 3 satisfacen la ecuación (1). Entonces la ecuación (1) es válida 
para cualesquiera tres valores consecutivos de k, por ejemplo, k,k + 1 y k + 2. Así, la ecua¬ 
ción ( 1 ) implica que 

C\Uk+i + C 2 Vk+\ + C 3 it> J t+i = 0 para toda k 


y 


c\Uk +2 + C 2 Vk +2 + CiWk +2 = 0 para toda k 
Por lo tanto c i, C 2 , C 3 satisfacen 


u k 

Vk 

W k 

c 1 


' 0 ' 

Uk+1 

Vk+\ 

Wk+l 

C2 

= 

0 

_ Uk+2 

Vk +2 

Wk+2 _ 

_ c 3 _ 


0 


para toda k 


( 2 ) 


La matriz de coeficientes de este sistema se llama la matriz de Casorati de las señales, y 
el determinante de la matriz se denomina casoratiano de {uk}, {v*} y [ w ¡ c } ■ Si la matriz de 
Casorati es invertible, para al menos un valor de k, entonces la ecuación (2) implicará que 
ci = c 2 = c 3 = 0 , lo que demuestra que las tres señales son linealmente independientes. 
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EJEMPLO 2 Compruebe que las señales l\ ( -2f y 3 k son linealmente independientes. 



k 


Las señales 1*. (—2/ y 3*. 


SOLUCIÓN La matriz de Casorati es 

" \ k {—2) k 3 k 

\ k +\ 3&+1 

^k+ 2 (_2 ^k+2 ^fc+2 

Con las operaciones de fila se puede demostrar muy fácilmente que esta matriz siempre es 
invertible. Sin embargo, es más rápido sustituir k por un valor, por ejemplo, k = 0 y reducir 
por filas la matriz numérica: 


■ 1 

1 

r 


" 1 

1 

1 " 


"1 

1 

1 " 

1 

-2 

3 

~ 

0 

-3 

2 

~ 

0 

-3 

2 

1 

4 

9 


0 

3 

8 


0 

0 

10 


La matriz de Casorati es invertible para k = 0. Por lo tanto, 1*, (—2) k y 3 k son linealmente 
independientes. ■ 


Si una matriz de Casorati no es invertible, las señales asociadas que se están sometiendo 
a prueba pueden o no ser linealmente dependientes. (Véase el ejercicio 33). Sin embargo, es 
posible demostrar que si todas las señales son las soluciones de la misma ecuación en diferen¬ 
cias homogénea (que se describe a continuación), entonces la matriz de Casorati es invertible 
para toda k y las señales son linealmente independientes, o bien, la matriz de Casorati no es 
invertible para toda k y las señales son linealmente dependientes. En la Guía de estudio se 
presenta una excelente demostración utilizando transformaciones lineales. 


Ecuaciones lineales en diferencias 

Considerando los escalares ao,..., a„, con ao y a„ diferentes de cero, y dada una señal { Zk }, 
la ecuación 

aoyk+n + ci\yk+n-\ - i - a„-iy k +i + a„y k = Zk para toda k (3) 

se llama una ecuación lineal en diferencias (o relación de recurrencia lineal) de orden n. 

Para simplificar, üq con frecuencia se considera igual a 1. Si { Zk } es la secuencia cero, la ecua¬ 
ción es homogénea; de lo contrario, la ecuación es no homogénea. 

EJEMPLO 3 En el procesamiento de señal digital, una ecuación en diferencias tal como 
la ecuación (3) describe un filtro lineal, y ao,..., a„ se denominan los coeficientes de filtro. 
Si { vr } se trata como la entrada y | Zk } como la salida, entonces las soluciones de la ecuación 
homogénea asociada son las señales que se filtran hacia fuera y se transforman en señal cero. 
Vamos a alimentar dos señales diferentes en el filtro 

• 35ví+ 2 + .5y¡fc+i + .35 y k = Zk 

Aquí, .35 es una abreviatura de V2/4. La primera señal se crea mediante el muestreo de 
la señal continua y = cos(77í/4) para valores enteros de t, como en la figura 3o). La señal 
discreta es 


{yk} = {..., cos(O), cos(jr/4), cos(27r/4), cos(3;r/4),...} 

Para simplificar, se escribe ±.7 en lugar de ±V2/2, de manera que 

{y k } = {..., 1, .7, 0, -.7, -1, -.7, 0, .7, 1, .7, 0,...} 

t 

k = 0 

La tabla 1 muestra el cálculo de la secuencia de salida {z*}, donde ,35(.7) es una abreviatura 
de ('s/2/4)(v / 2/2) = .25. La salida es {y¿}, corrida un término. 
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t 


a) 

FIGURA 3 Señales discretas con diferentes frecuencias. 


b) 


TABLA 1 Cálculo de la salida de un filtro 


k 

yk 

y k + 1 

yk +2 

35y k 

+ -Syic+i + •35y¿+2 = Z k 

0 

1 

.7 

0 

.35(1) 

+ ,5(.7) + .35(0) = .7 

1 

.7 

0 

-.7 

•35(.7) 

+ .5(0) + .35(—.7) = 0 

2 

0 

-.7 

-1 

.35(0) 

+ .5(—.7) + ,35(—1) = -.7 

3 

—.7 

-1 

-.1 

,35(—.7) + ,5(—1) + ,35(—.7) = -1 

4 

-1 

-.7 

0 

•35(—1) 

+ ,5(—.7) + .35(0) = -.7 

5 

—.7 

0 

.7 

,35(—.7) + .5(0) + ,35(.7) = 0 


Una señal de entrada diferente se produce a partir de la mayor frecuencia de la señal 
y = cos(37 tí/ 4), que se muestra en la figura 3b). El muestreo a la misma tasa de antes produce 
una nueva secuencia de entrada: 

{xv k } = {..., 1, -.7, 0, .7, -1, .7, 0, -.7, 1, -.7, 0,...} 

t 

k = 0 

Cuando se alimenta al filtro con {&><. }, la salida es la secuencia cero. El filtro, conocido como 
filtro pasa bajos, hace que {v*} pase, pero detiene a las señales de mayor frecuencia {«/..}. ■ 

En muchas aplicaciones, se especifica una secuencia {z^.} para el lado derecho de una 
ecuación en diferencias (3), y una {y¿} que satisface la ecuación (3) se considera una solución 
de la ecuación. El siguiente ejemplo ilustra cómo encontrar soluciones para una ecuación 
homogénea. 

EJEMPLO 4 Soluciones de una ecuación homogénea en diferencias a menudo tienen la 
forma y= r k para alguna r. Encuentre algunas soluciones de la ecuación 

Vk +3 - 2.VA+2 - 5yic+\ + 6 y k = o para toda k (4) 

SOLUCION Se sustituye y k por /' en la ecuación y se factoriza el lado izquierdo: 

r k+3 - 2r k+2 - 5r k+1 + 6r k = 0 (5 ) 

r k (r 3 — 2r 2 — 5r + 6) = 0 

r k (r — l)(r + 2)(r — 3) = 0 (6) 

Como (5) es equivalente a (6), r k satisface la ecuación en diferencias (4) si y solo si r satisface 
(6). Así, \ k , (—2) k y 3 k son todas soluciones de (4). Por ejemplo, para comprobar que 3 k es 
una solución de (4), calcule 

3 k+3 - 2 ■ 3 k+2 - 5 • 3 a+1 + 6 • 3 k 

= 3* (27 — 18 — 15 + 6) = 0 para toda k ■ 



248 


CAPÍTULO 4 Espacios vectoriales 


En general, una señal distinta de cero r k satisface la ecuación homogénea en diferencias 

yk+n + aiyk+n -1 H-H a n -iy k +\ + a„y k = 0 para toda k 

si y solo si r es una raíz de la ecuación auxiliar 

r n + ci\r n ~ x -\ -1- a n -\r + a„ = 0 

No vamos a considerar el caso en que r es una raíz repetida de la ecuación auxiliar. Cuando 
la ecuación auxiliar tiene una raíz compleja, la ecuación en diferencias tiene soluciones de la 
forma s k eos ka> y s k sen ka>, para las constantes s y a>. Esto sucedió en el ejemplo 3. 

Conjuntos de soluciones de ecuaciones lineales 
en diferencias 

A partir de ai,..., a„, considere el mapeo T : S —» § que transforma una señal {y k } en una 
señal ¡ at k } dada por 

Wk = Vk+n + aiy k + n -\ -f a«—U/fc+i + a n y k 

Es fácil comprobar que T es una transformación lineal. Esto implica que el conjunto solución 
de la ecuación homogénea 

yk+n + aiyk+n-i d-1- a n -iyk+i + a n y k = 0 para toda k 

es el núcleo de T (el conjunto de las señales que T mapea en la señal cero) y, por lo tanto, el 
conjunto solución es un subespacio de S. Cualquier combinación lineal de soluciones es de 
nuevo una solución. 

El siguiente teorema, un resultado sencillo, pero básico, conducirá a mayor información 
acerca de los conjuntos solución de ecuaciones en diferencias. 


TEOREMA 16 Si a n A 0 y si {z*} está dada, la ecuación 

y k +n + aiy k+n -1 + ••• + a„-iy k +i + a n y k = z k para toda k (7) 
tiene una única solución siempre que se especifican yo,..., y n -i- 


DEMOSTRACIÓN Si yo,..., y n -\ se especifican, utilice la ecuación (7) para definir 
y„ = Zo - [tfiJn -1 +-H a n -iyi + a n y 0 ] 

Y ahora que yi,..., y„ se especifican, utilice (7) para definir y„ + j. En general, utilice la rela¬ 
ción de recurrencia 

yn+k = Z k \a\y k j rU —\ +•••-{“ a n y k ] (8) 

para definir y n+k para k> 0. Para definir y k para k < 0, utilice la relación de recurrencia 

yk = — Zk -[ y k +n + a \yk+n-l + ••• + a n -iy k +i ] (9) 

Ctyi Cl yi 

Esto produce una señal que satisface la ecuación (7). A la inversa, cualquier señal que satis¬ 
face la ecuación (7) para toda k sin duda satisface las ecuaciones (8) y (9), por lo que la solu¬ 
ción de la ecuación (7) es única. ■ 

TEOREMA 17 El conjunto H de todas las soluciones de la ecuación lineal homogénea en diferencias 
de n-ésimo orden 

y k +n + a\y k +n-\ + ••• + a n -iy k+ i + a n y k = 0 para toda k (10) 
es un espacio vectorial de dimensión n. 
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DEMOSTRACIÓN Como se indicó antes, H es un subespacio de S porque H es el nú¬ 
cleo de una transformación lineal. Para {y k } en H, sea F{y k } el vector en IR" dado por 
(yo, yi,..., y„-i). Es posible comprobar fácilmente que F : H —» R" es una transformación 
lineal. Dado cualquier vector (yo, y i,..., y„-i) en R", el teorema 16 dice que hay una única 
señal {y k } en H tal que F{y k } = (yo, yi,..., y,¡ i). Esto significa que F es una transformación 
lineal uno a uno de H sobre R", es decir, F es un isomorfismo. Así, dim H = dim R" = n. 
(Véase el ejercicio 32 en la sección 4.5). ■ 

EJEMPLO 5 Encuentre una base para el conjunto de todas las soluciones a la ecuación 
en diferencias 


yk +3 ~ 2y k+2 - 5y¿+i + 6 y k = 0 para toda k 

SOLUCIÓN Nuestro trabajo en álgebra lineal ¡realmente está rindiendo frutos ahora! Sabemos 
a partir de los ejemplos 2 y 4 que 1*-', (—2) k y 3 k son soluciones linealmente independientes. 
En general, puede ser difícil comprobar directamente que un conjunto de las señales genera el 
espacio solución. Pero eso no es problema en este caso, debido a dos importantes teoremas: 
el teorema 17, que demuestra que el espacio solución es exactamente de dimensión 3, y el 
teorema de la base de la sección 4.5, el cual afirma que un conjunto linealmente independiente 
de n vectores en un espacio de dimensión n es automáticamente una base. Así, \ k , ( — 2 f y 3 k 
forman una base para el espacio solución. ■ 

La solución estándar para describir la “solución general” de la ecuación en diferencias 
(10) es mostrar una base para el subespacio de todas las soluciones. Dicha base se suele 
denominar conjunto fundamental de soluciones de (10). En la práctica, si se encuentran n 
señales linealmente independientes que satisfagan (10), de manera automática generarán el 
espacio de soluciones de dimensión n, como se explica en el ejemplo 5. 

Ecuaciones no homogéneas 

La solución general de la ecuación no homogénea en diferencias 

yk+n + aiy k + n -\ 4-b a n -iy k+ i + a„y k = z k para toda k (11) 

se puede escribir como una solución particular de (11) más una combinación lineal arbitraria 
de un conjunto fundamental de soluciones de la ecuación homogénea correspondiente (10). 
Este hecho es análogo al resultado de la sección 1.5 que muestra que los conjuntos solución 
de Ax = b y Ax = 0 son paralelos. Ambos resultados tienen la misma explicación: el mapeo 
x i-» Ax es lineal, y el mapeo que transforma la señal {y*} en la señal {zr} en (11) es lineal. 
Véase el ejercicio 35. 

EJEMPLO 6 Compruebe que la señal y k = k 2 satisface la ecuación en diferencias 

yk +2 - 4y )t +i + 3yí; = -4 k para toda k (12) 

Luego, encuentre una descripción de todas las soluciones de esta ecuación. 

SOLUCIÓN Sustituya y k por k 2 en el lado izquierdo de (12): 

(k+2) 2 -4(k + l) 2 + 3 k 2 

= (k 2 + 4k + 4) - 4 (k 2 + 2k + 1) + 3 k 2 
= -4 k 

Así, k 2 es de hecho una solución de (12). El siguiente paso es resolver la ecuación homogénea 

yk +2 - 4 y k +\ + 3y k = 0 (13) 

La ecuación auxiliar es 

r 2 — 4r + 3 = (r — 1) (r — 3) = 0 
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FIGURA 4 

Conjuntos solución de las 
ecuaciones en diferencias 
(12) y (13). 


Las raíces son r = 1,3. Así que dos soluciones de la ecuación homogénea en diferencias son 
l k y 3 k . Evidentemente, no son múltiplos una de la otra, por lo que son señales linealmente 
independientes. De acuerdo con el teorema 17, el espacio solución es de dimensión 2, de 
manera que 3 /f y \ k forman una base para el conjunto de soluciones de la ecuación (13). Al 
trasladar ese conjunto mediante una solución particular de la ecuación no homogénea (12), se 
obtiene la solución general de (12): 

k ^ + C\ 1^ + c 2 3 k o k^ + c\ + c 2 3 k 

La figura 4 muestra una visualización geométrica de los dos conjuntos solución. Cada punto 
de la figura corresponde a una señal en S. ■ 

Reducción a sistemas de ecuaciones de primer orden 

Una forma moderna de estudiar una ecuación en diferencias homogénea de n-ésimo orden es 
remplazaría por un sistema equivalente de ecuaciones en diferencias de primer orden, escrito 
en la forma 


Xjt+i = Ax k para toda k 

donde los vectores X/. están en IR" y A es una matriz de n x n. 

Un ejemplo sencillo de tal ecuación en diferencias (con valor vectorial) se estudió ya en 
la sección 1.10. Otros ejemplos se tratarán en las secciones 4.9 y 5.6. 

EJEMPLO 7 Escriba la siguiente ecuación en diferencias como un sistema de primer 
orden: 


yk +3 - 2 y k +2 - 5_yjr+i + 6 y k = 0 para toda k 


SOLUCIÓN Para cada k, establezca 


xa 


yk 

yk+i 

Vk+2 


La ecuación en diferencias dice que Va +3 = — 6y k + 5ja+i + 2yA+2, por lo que 


XA+l 


Es decir. 


y k + 1 
y k + 2 

— 

0 + .Va+1 + 0 

0+0 + JA+2 

— 

0 

0 

1 0" 
0 1 

y k 

y k + 1 

_ LA+3 _ 


_ — 6va + 5ja+i + 2va+2 _ 


-6 

5 2 

_ yk+ 2 _ 




r 

0 

1 01 



xa+i = Ax a para toda k, donde A = 


0 0 1 


En general, la ecuación 

y k +n + aiyic+n-i -f- fln-tjA+1 + a„y k = 0 para toda k 


se puede rescribir como x^+i = Ax k para toda k, donde 




0 

i 

0 

0 ' 

VA 

y k +1 


0 

0 

i 

0 


, a = 





_ y k +n-\ _ 


0 

0 

0 

1 



_ & n 

6^n —1 

<N 

1 

K 

3 

1 

•• —a\_ 


xa = 
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PROBLEMA DE PRÁCTICA 

Es posible demostrar que las señales 2 k , 3 k sen y 3 k eos son soluciones de 

Yk+ 3 - 2y k+2 + 9y k+1 - 18y¿ = 0 

Demuestre que estas señales forman una base para el conjunto de todas las soluciones de la 
ecuación en diferencias. 


4.8 EJERCICIOS 


Compruebe que las señales de los ejercicios 1 y 2 son soluciones de 
la ecuación en diferencias correspondiente. 

1. 2 k , (—4)*; y k+1 + 2 y k+l - 8 y k = 0 

2. 5*. (-5)*; y k+2 -25y k =0 

Demuestre que las señales en los ejercicios 3 a 6 forman una base 
para el conjunto solución de la ecuación en diferencias correspon¬ 
diente. 

3. Las señales y la ecuación en el ejercicio 1 

4. Las señales y la ecuación en el ejercicio 2 

5. (■ -2) k , k(-2) k ; y k+2 + 4 y k+l + 4 y k = 0 

6. 4 k eos Cf), sen {*f)\ y k+2 + 16 y k = 0 

En los ejercicios 7 a 12, suponga que las señales listadas son solucio¬ 
nes de la ecuación en diferencias dada. ¿Las señales forman una base 
para el espacio solución de la ecuación? Justifique sus respuestas 
usando los teoremas adecuados. 

7. l k , 2 k , (—2) k ; y k + 3 - y k+2 - 4y, +1 + 4 y k = 0 

8 . (-1)*, 2 k , 3 k -, y k + 3 - 4 y k+2 4- 1 y k+l + 6 y k = 0 

9. 2 k , 5 k eos Cff), 5 k sen (^); 

J't+3 - 2y k +2 + 25y k +i - 50 y k = 0 

10. {—2) k , k(-2) k , 3 k ; y k+3 + v k+2 - 8y t+1 - 12 y k = 0 

11. (-1)*, 2 k -, y k+ 3 - 3 y k+2 + 4 y k = 0 

12. 3*, (-2)*; y k+4 - l3y k+2 + 36y k = 0 


En los ejercicios 13 a 16, encuentre una base para el espacio solución 
de la ecuación en diferencias. Demuestre que las soluciones que en¬ 
cuentre generan al conjunto solución. 

13. y k + 2 - y k +i + \y k = 0 14. y k+2 - 5>>*+i + 6y k = 0 

15. 6y k+2 + y k +\ - 2y k = 0 16. y k +i - 25y k = 0 

Los ejercicios 17 y 18 se refieren a un modelo sencillo de la econo¬ 
mía nacional descrito por la ecuación en diferencias 

Y k +2 ~ o.{ 1 + b)Y t+i + abY k = 1 (14) 

Aquí Y k es el ingreso nacional total durante el año k, a es una 
constante menor que 1 , que se llama propensión marginal al consu¬ 
mo, y b es una constante de ajuste positiva que describe cómo los 
cambios en el gasto de consumo afectan la tasa anual de inversión 
privada . 1 

17. Determine la solución general de la ecuación (14) cuando 
a = .9 y b = |. ¿Qué pasa con Y k conforme k aumenta? 
[Sugerencia: En primer lugar, encuentre una solución particu¬ 
lar de la forma Y k = T, donde T es una constante, llamada el 
nivel de equilibrio del ingreso nacional], 

18. Determine la solución general de la ecuación (14), cuando 
a = .9 y b = .5. 


1 Por ejemplo, véase Discrete Dynamical Systems, de James T. Sandefur 
(Oxford: Clarendon Press, 1990), pp. 267-276. El modelo original acelera¬ 
dor-multiplicador se atribuye al economista P. A. Samuelson. 
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Una viga ligera en voladizo está soportada en los puntos N espa¬ 
ciados por una distancia de 10 ft, y se coloca un peso de 500 Ib en 
el extremo de la viga, a 10 ft del primer soporte, como se muestra 
en la figura. Sea y k el momento Héctor en el fc-ésimo soporte. Lue¬ 
go, y\ = 5000 ft-lb. Suponga que la viga está rígidamente sujeta al 
ÍV-ésimo soporte y el momento flector ahí es cero. En medio, los 
momentos satisfacen la ecuación de tres momentos 

yic +2 + fyk+\ + yk = 0 para k = 1,2,.... Al — 2 (15) 


Y —io’— yf —íc——io'— 

A A A 

f y ^ ^ 

Momentos flectores en una viga en voladizo. 



19. Determine la solución general de la ecuación en diferencias 
(15). Justifique su respuesta. 

20. Encuentre la solución particular de la ecuación (15) que satisfa¬ 
ce las condiciones frontera y\ = 5000 y yn = 0. (La respuesta 
implica a N). 

21. Cuando se produce una señal a partir de una secuencia de me¬ 
diciones efectuadas en un proceso (una reacción química, un 
flujo de calor a través de un tubo, un brazo robot en movi¬ 
miento, etcétera), la señal, por lo general, contiene mido alea¬ 
torio producido por errores de medición. Un método estándar 
de procesamiento previo de los datos para reducir el ruido es 
suavizar o filtrar los datos. Un sencillo filtro es un promedio 
móvil que sustituye caday* por su promedio con los dos valores 
adyacentes: 

\yk +1 + \y k + \y k -1 = z k para k = 1, 2 ,... 

Suponga que una señal y k , para k = 0,..., 14, es 
9, 5, 7, 3, 2, 4, 6, 5, 7, 6, 8, 10, 9, 5, 7 

Utilice el filtro para calcular Zi,..., Z13. Trace una gráfica de 
línea discontinua que se superponga a la señal original y a la 
señal suavizada. 

22. Sea {v*} la secuencia producida por la toma de muestras de se¬ 
ñal continua 2 eos ^ + eos en t — 0, 1,2,..., como se indica 
en la figura. Los valores de y k , empezando con k = 0, son 

3, .7, 0, -.7, -3, -.7, 0, .7, 3, .7, 0, ... 


1 + 


nt , 3jct 


y — 1 eos ~r + eos 


LLA 


rrr 




-1 + 


1 2 


Datos de la muestra de 2 eos ^ + eos pp 


Los ejercicios 23 y 24 se refieren a una ecuación en diferencias de la 
forma y k \-\ — ay k = b, para constantes adecuadas ay b. 

23. Un préstamo de $10,000 tiene una tasa de interés del 1% men¬ 
sual y requiere un pago mensual de $450. El préstamo se realiza 
en el mes k = 0 , y el primer pago se realiza un mes después, en 
k — 1. Para k = 0, 1, 2,..., seayjt el saldo insoluto del préstamo 
justo después del ¿-ésimo pago mensual. Así, 

yi = 10,000 + (.01)10,000 - 450 
Nuevo Saldo Intereses Pago 
saldo adeudado agregados 

a) Escriba una ecuación en diferencias satisfecha por { vit}. 

b) [M] Cree una tabla que muestre k, y el saldo y k al mes k. 
Liste el programa o los tecleos (las instrucciones) para crear 
la tabla. 

c) [M] ¿Cuál es el valor de k cuando se efectúa el último pago? 
¿De cuánto será el último pago? ¿Cuánto dinero en total 
pagó el deudor? 

24. En el tiempo k = 0, con una inversión inicial de $1000 se abre 
una cuenta de ahorros que paga el 6 % de interés anual con ca¬ 
pitalización mensual. (La tasa de interés mensual es de .005). 
Cada mes después de la inversión inicial, se agregan $200 a la 
cuenta. Para/r = 0, 1, 2,..., sea y k la cantidad que hay en la cuen¬ 
ta al momento k, justo después de que se hace un depósito. 

a) Escriba una ecuación en diferencias que satisfaga {y*}. 

b) [M] Cree una tabla que muestre k, y la cantidad total en la 
cuenta de ahorros en el mes k, para k = 0 a 60. Liste su pro¬ 
grama o los tecleos (las instrucciones) que utilizó para crear 
la tabla. 

c) [M] ¿Cuánto habrá en la cuenta después de dos años (es de¬ 
cir, 24 meses), cuatro años, y cinco años? ¿Qué parte del 
total a los cinco años corresponderá a los intereses? 

En los ejercicios 25 a 28, demuestre que la señal dada es una solu¬ 
ción de la ecuación en diferencias. Luego, determine la solución ge¬ 
neral de esa ecuación en diferencias. 


donde .7 es una abreviatura de y/2/2. 

a) Calcule la señal de salida {z k } cuando {y k } alimenta al filtro 
del ejemplo 3. 

b) Explique cómo y por qué la salida en el inciso a) está rela¬ 
cionada con los cálculos del ejemplo 3. 


25. y k = k 2 \ y k +2 + 3y* +1 - 4 y k = 7 + 10 k 

26. y k = 1 + k; y k+2 - 6y*+i + 5y k = -4 

27. y k = k - 2; y k+2 - 4 y k = 8-3 k 

28. y k = 1 4- 2 k; y k + 2 - 25v k = -48 k - 20 
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Escriba las ecuaciones en diferencias en los ejercicios 29 y 30 como 
sistemas de primer orden, xa+i = Ax k , para toda k. 

29. y k + 4 + 3^+3 - 8 v *+2 + 6y k +1 - 2 y k = 0 

30. y k +i - 5vt +2 + 8va = 0 

31. ¿La siguiente ecuación en diferencias es de orden 3? Explique 
su respuesta. 

y k +3 + 5 va.-|-2 + (>y k +i = 0 

32. ¿Cuál es el orden de la siguiente ecuación en diferencias? Expli¬ 
que su respuesta. 

y k +3 + a\y k +2 + aiy k +\ + a?,y k = o 

33. Sea y k = k 2 y z k — 2k\k\ . ¿Las señales ¡va) y {z k } son lineal¬ 
mente independientes? Evalúe la matriz de Casorati C(k) aso¬ 
ciada para k = 0 , k = — 1 y k = —2, y analice sus resultados. 

34. Sean/, g y h, funciones linealmente independientes definidas 
para todos los números reales, y construya tres señales por mues- 
treo de los valores de las funciones de los números enteros: 

u k = f(k), v k = g{k). w k = h(k) 


¿Es necesario que las señales sean linealmente independientes 
en S? Analícelo. 

35. Sean ay b números diferentes de cero. Demuestre que el mapeo 
T definido por T{y k } — {w k }, donde 

m = y k +2 + ay k +i + by k 

es una transformación lineal de § en S. 

36. Sea V un espacio vectorial, y sea T : V — > V una transformación 
lineal. Dada z en V, suponga que x p en V satisface T(x p ) = z, 
y sea u cualquier vector en el núcleo de T. Demuestre que 
u + x p satisface la ecuación no homogénea T(x) = z. 

37. Sea So el espacio vectorial de todas las secuencias de la forma 
(y 0 , yi.y 2 ,...), y defina las transformaciones lineales Ty D de So 
dentro de So por 

T(y 0 .yi.yi. •••) = (yi, yi, ys,. • •) 

D(yo. yu yi, • • •) = (0, y 0 , yi,y 2 , ■ • •) 

Demuestre que TD = I (la transformación identidad en So) y 
que, sin embargo, DT # I. 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Examine la matriz de Casorati: 


C(k) = 


2 k 

2 k+1 
2 k+2 


3 k ssn'f 
3 k+1 sen^-y^ 
3 k+2 sen^ 


3 k eos 

3 k+1 eos ^ 
3 k + 2 cos <*d^i 


Sea k = 0 y reduzca por filas la matriz para comprobar que tiene tres posiciones pivote y que, 
por lo tanto, es invertible: 


1 

0 

r 


" 1 

0 

r 

2 

3 

0 


0 

3 

-2 

4 

0 

-9 


0 

0 

-13 


La matriz de Casorati es invertible en k = 0, por lo que las señales son linealmente inde¬ 
pendientes. Puesto que hay tres señales, y el espacio solución H de la ecuación en diferencias 
es de dimensión 3 (teorema 17), las señales forman una base para H , de acuerdo con el teo¬ 
rema de la base. 


4.9 APLICACIONES A CADENAS DE MARKOV 


Las cadenas de Markov descritas en esta sección se utilizan como modelos matemáticos de 
una amplia variedad de situaciones en biología, negocios, química, ingeniería, física y otros 
campos. En cada caso, el modelo se utiliza para describir un experimento o una medición 
que se realiza muchas veces de la misma manera, cuando el resultado de cada ensayo del 
experimento será uno de varios posibles resultados especificados, y depende solo del ensayo 
inmediato anterior. 

Por ejemplo, si la población de una ciudad y sus suburbios se midieran cada año, enton¬ 
ces un vector tal como 

.60 
.40 


xo = 


( 1 ) 
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podría indicar que el 60% de la población vive en la ciudad y el 40% en los suburbios. 
Los decimales en xo suman 1, ya que dan cuenta de toda la población de la región. Los por¬ 
centajes son más convenientes para nuestros propósitos en este momento que los totales de 
población. 

Un vector con entradas no negativas que suman 1 se llama vector de probabilidad. 
Una matriz estocástica es una matriz cuadrada cuyas columnas son vectores de probabili¬ 
dad. Una cadena de Markov es una secuencia de vectores de probabilidad de xo, X|, X 2 ,..., 
junto con una matriz estocástica P, tal que 

Xi = Px o, x 2 = Pxi , x 3 = Px 2 , ... 

Así, la cadena de Markov se describe mediante la ecuación en diferencias de primer orden 

Xi+i = Pxk para k = 0, 1, 2,... 

Cuando una cadena de Markov de vectores en IR" describe un sistema o una serie de 
experimentos, las entradas en x¡¡ listan, respectivamente, las probabilidades de que el sistema 
esté en cada uno de los n posibles estados, o las probabilidades de que el resultado del expe¬ 
rimento sea uno de los n posibles resultados. Por esta razón, x¿- con frecuencia se llama un 

vector de estado. 


EJEMPLO 1 En la sección 1.10 se examinó un modelo para los movimientos de pobla¬ 
ción entre una ciudad y sus suburbios. Véase la figura 1. La migración anual entre estas dos 
partes de la zona metropolitana se regía por la matriz de migración M: 


De: 


Ciudad Suburbios De: 


.95 .03 

05 .97 


Ciudad 

Suburbios 


Es decir, cada año el 5% de la población de la ciudad se muda a los suburbios, y el 3% de la 
población de los suburbios se muda a la ciudad. Las columnas de M son vectores de probabili¬ 
dad, por lo que M es una matriz estocástica. Suponga la población de la región en el año 2000 
era de 600,000 en la ciudad y de 400,000 en los suburbios. Entonces, la distribución inicial de 
la población en la región está dada por xo en la ecuación (1) anterior. ¿Cuál es la distribución 
de la población en el año 2001? ¿Y en 2002? 



FIGURA 1 Migración porcentual anual entre la ciudad y los suburbios. 


SOLUCIÓN En el ejemplo 3 de la sección 1.10, vimos que después de un año, el vector de 
'600,000' 


población 


400,000 


cambió a 


'.95 

.03' 

'600,000' 


'582,000' 

.05 

.97 

400,000 


418,000 
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Si dividimos ambos lados de esta ecuación entre la población total de un millón y considera¬ 
mos el hecho de que kMx = M(kx), se encuentra que 


'.95 

.03' 

O 

O 


'.582' 

.05 

.97 

1- 

o 

o 

1_ 


.418 


El vector xi 


.582 

.418 


da la distribución de la población en 2001. Es decir, el 58.2% de la 


región vivía en la ciudad y el 41.8% vivía en los suburbios. Del mismo modo, la distribución 
de la población en el año 2002 se describe por un vector X 2 , donde 


'.95 

.03' 

'.582' 


'.565' 

.05 

.97 

.418 


.435 


EJEMPLO 2 Suponga que el resultado de la votación durante las elecciones de un con¬ 
greso en un distrito de votación está representado por un vector x en IR 3 : 


% de votación por los demócratas (D) 
% de votación por los republicanos (R) 
% de votación por los liberales (L) 


Suponga que se registra el resultado de las elecciones al congreso cada dos años mediante 
un vector de este tipo y que el resultado de una elección solo depende de los resultados de 
la elección anterior. Entonces, la secuencia de los vectores que describen los votos cada dos 
años puede ser una cadena de Markov. Como un ejemplo de una matriz estocástica P para 
esta cadena, tomamos 



De: 



D 

R 

L 

A: 

.70 

.10 

.30” 

D 

.20 

.80 

.30 

R 

.10 

.10 

.40 

L 

denotada 

como D, describen 


P = 


próximas elecciones las personas que votaron por los demócratas en una elección. Aquí su¬ 
pusimos que el 70% votará de nuevo por los demócratas en las próximas elecciones, el 20% 
votará por los republicanos, y el 10% dará su voto a los liberales. Similares interpretaciones 
valen para las otras columnas de P. Un diagrama de esta matriz se presenta en la figura 2. 


.70 .80 



.40 

FIGURA 2 Cambios en la votación de una elección 
a la siguiente. 
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Si los porcentajes de “transición” se mantienen constantes a lo largo de muchos años 
de una elección a otra, entonces la secuencia de los vectores que dan los resultados de la 
votación constituye una cadena de Markov. Suponga que el resultado de una elección está 
dado por 


xo 


.55 

.40 

.05 


Determine el resultado probable de la siguiente elección y el resultado probable de la elección 
posterior. 

SOLUCIÓN El resultado de la siguiente elección se describe mediante el vector de estado xi 
y el de la elección posterior por X 2 , donde 



'.70 

.10 

.30" 

".55" 


'.440' 

El 44% votará por D 

II 

0 

X 

II 

.20 

.80 

.30 

.40 

= 

.445 

El 44.5% votará por R 


.10 

.10 

.40 

.05 


.115 

El 11.5% votará por L 



".70 

.10 

.30" 

".440" 


".3870 

El 38.7% votará por D 

¡*! 

K) 

II 

* 

II 

.20 

.80 

.30 

.445 

= 

.4785 

El 47.8% votará por R 


.10 

.10 

.40 

.115 


.1345 

El 13.5% votará por L 


Para entender por qué x¡, efectivamente, da el resultado de las próximas elecciones, su¬ 
ponga que 1000 personas votaron en la “primera” elección, con 550 votos a favor de D, 400 
votos a favor de R y 50 votos a favor de L. (Véase los porcentajes en xo). En la siguiente 
elección, el 70% de los 550 votarán de nuevo por D, el 10% de los 400 cambiará su voto de 
R a D, y el 30% de los 50 cambiará de L a D. De esta forma, el total de votos para D será 

.70(550) + .10(400) + .30(50) = 385 + 40 + 15 = 440 (2) 

Así, el 44% de la próxima votación será a favor del candidato demócrata. El cálculo en (2) 
es, en esencia, el mismo que se utilizó para calcular la primera entrada en xi. Se podrían 
hacer cálculos análogos para las otras entradas en xi, para las entradas en X 2 , y así suce¬ 
sivamente. ■ 


Predicciones del futuro lejano 

El aspecto más interesante de las cadenas de Markov es el estudio del comportamiento a largo 
plazo de una cadena. Por ejemplo, ¿qué se puede decir en el ejemplo 2 de la votación después 
de que han pasado muchas elecciones (suponiendo que la matriz estocástica dada continúe 
describiendo los porcentajes de transición de una elección a la siguiente)? O, ¿qué sucede 
con la distribución de la población en el ejemplo 1 “a largo plazo”? Antes de responder estas 
preguntas, veamos un ejemplo numérico. 


EJEMPLO 3 



".5 

.2 

.3 


' 1~ 


Sea P = 

.3 

.8 

.3 

y x 0 = 

0 

. Considere un sistema cuyo estado 


.2 

0 

.4 


0 



está descrito por la cadena de Markov x^+i = Px / ; , para k = 0, 1,... ¿Qué sucede con el 
sistema a medida que transcurre el tiempo? Para averiguarlo, calcule los vectores de es¬ 
tado de Xi,..., X 15 . 
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SOLUCIÓN 



'.5 

.2 

.3" 

"l" 




51 


* 

II 

* 

o 

II 

.3 

.8 

.3 

0 


= 

.3 



.2 

0 

.4 

0 




2 J 



'.5 

.2 

.3" 

~.5" 



- 

.37" 

¡*! 

K> 

II 

* 

II 

.3 

.8 

.3 

.3 


= 


.45 


.2 

0 

.4 

.2 




.18 


'.5 

.2 

.3" 

".37 

- 



'.329 

x 3 = Px 2 = 

.3 

.8 

.3 

.45 


= 


.525 


.2 

0 

.4 

.18 




.146 


Los resultados de los cálculos posteriores se muestran a continuación, con las entradas redon¬ 
deadas a cuatro o cinco cifras significativas. 



".3133" 


" .3064 


".3032" 


".3016" 

x 4 = 

.5625 

, x 5 = 

.5813 

, x 6 

.5906 

, x 7 = 

.5953 


.1242 


.1123 


.1062 


.1031 


".3008" 


".3004" 


".3002" 


".3001 " 

x 8 = 

.5977 

, X 9 = 

.5988 

■ X 10 = 

.5994 

, x n = 

.5997 


.1016 


.1008 


.1004 


.1002 



" .30005 


" .30002 " 


" .30001 


".30001" 

Xl2 = 

.59985 

.10010 

, x 13 = 

.59993 

.10005 

. x 14 = 

.59996 

.10002 

, x 15 = 

.59998 

.10001 


Estos vectores parecen acercarse a q = 



Las probabilidades son difíciles de cambiar 


de un valor de k al siguiente. Observe que el siguiente cálculo es exacto (sin errores de 
redondeo): 


".5 

.2 

.3" 

".3" 


".15 + .12 + .03 ' 


".30" 

.3 

.8 

.3 

.6 

= 

.09 + .48 + .03 

= 

.60 

.2 

0 

.4 

.1 


_ .06 + 0 + .04 _ 


.10 


Cuando el sistema está en estado q, no hay ningún cambio en el sistema de una medición a 
la siguiente. ■ 


Vectores de estado estable 

Si P es una matriz estocástica, entonces un vector de estado estable (o vector de equilibrio) 
de P es un vector de probabilidad q tal que 

Pq = q 

Es posible demostrar que toda matriz estocástica tiene un vector de estado estable. En el 
ejemplo 3, q es un vector de estado estable de P. 


EJEMPLO 4 El vector de probabilidad q = 


.375 

.625 


es un vector de estado estable para 


la matriz de migración de población M en el ejemplo 1, porque 



.95 

.03' 

T -3751 


'.35625 + .01875" 


[-.3751 

.05 

.97 

o\ 


.01875 + .60625 


N> 

Oí 
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Si el total de la población de la región metropolitana en el ejemplo 1 es de 1 millón, en¬ 
tonces q del ejemplo 4 correspondería a tener 375,000 personas en la ciudad y 625,000 en los 
suburbios. Al final de un año, la emigración de la ciudad sería (.05)(375,000) = 18,750 perso¬ 
nas, y la inmigración a la ciudad proveniente de los suburbios sería (,03)(625,000) = 18,750 
personas. Como resultado, la población de la ciudad seguiría siendo la misma. Asimismo, la 
población de los suburbios se mantendría estable. 

El siguiente ejemplo muestra cómo encontrar un vector de estado estable. 


EJEMPLO 

SOLUCIÓN 


5 Sea P = 


.6 

.4 


. Encuentre un vector de estado estable para P. 


En primer lugar, se resuelve la ecuación Px = x. 

Px — x = 0 

Px — Ix = 0 Recuerde de la sección 1.4 que Ix = x. 
(P — I)x = 0 


Para la P anterior. 


'.6 

.3' 


' 1 

0' 


'-.4 

.3' 

.4 

.7 


0 

1 


.4 

-.3 


P - I = 

Para encontrar todas las soluciones de (P — I)x = 0, se reduce por filas la matriz aumentada: 


1 

4 ^ 

.3 

O 


r-4 

.3 

0 


^t- 

m 

1 

O 

1 - 

4 ^ 

-.3 

O 

1_ 


0 

_1 

0 

0 

1_ 


[o 0 

O 

1 _ 


Entonces x\ = j.x 2 y .12 es libre. La solución general es x 2 


3/4 

1 


A continuación, se elige una base sencilla para el espacio solución. Una elección evi¬ 


dente es 


3/4' 

1 


, pero una mejor opción, sin fracciones, es w = 


(correspondiente 


a x 2 = 4). 

Por último, encuentre un vector de probabilidad en el conjunto de todas las soluciones de 
Px = x. Este proceso es fácil, ya que cada solución es un múltiplo de la solución w anterior. 
Divida w entre la suma de sus entradas para obtener 


q = 


3/7 

4/7 


Para comprobar, calcule 


' 6/10 

3 / 10 " 

' 3 / 7 ' 


' 18/70+ 12/70' 


'30/70' 

4/10 

7/10 

_ 4/7 


12/70 + 28/70 


40/70 


El siguiente teorema demuestra que lo que sucedió en el ejemplo 3 es característico de 
muchas matrices estocásticas. Decimos que una matriz estocástica es regular si alguna poten¬ 
cia de la matriz P k contiene solo entradas estrictamente positivas. Para P en el ejemplo 3, 


.37 

.26 

.33 

.45 

.70 

.45 

.18 

.04 

.22 


Ya que cada entrada en P 2 es estrictamente positiva, P es una matriz estocástica regular. 

Además, se dice que una secuencia de vectores {x^: k = 1, 2,...} converge a un vector 
q conforme k —» 00 si las entradas en x¡¡ se pueden acercar tanto como se desee a las entradas 
correspondientes en q al hacer a k suficientemente grande. 



4.9 Aplicaciones a cadenas de Markov 259 


TEOREMA 18 Si P es una matriz de n x n estocástica regular, entonces P tiene un único vector 
de estado estable q. Además, si xo es cualquier estado inicial y una x*+i = Px/¡ para 
k = 0, 1, 2,..., entonces la cadena de Markov {x¿-} converge a q conforme k —» °°. 


Este teorema se demuestra en los libros que analizan cadenas de Markov. La parte sor¬ 
prendente del teorema es que el estado inicial no tiene ningún efecto sobre el comportamiento 
a largo plazo de la cadena de Markov. Se verá más adelante (en la sección 5.2) por qué esto es 
cierto para varias matrices estocásticas estudiadas aquí. 

EJEMPLO 6 En el ejemplo 2, ¿qué porcentaje de los electores tienden a votar por el 
candidato republicano en alguna elección muchos años después a partir de ahora, suponiendo 
que el resultado de las elecciones forman una cadena de Markov? 

SOLUCIÓN Para los cálculos a mano, el enfoque equivocado es elegir algún vector inicial 
Xo y calcular xi,..., x¿ para algún valor grande de k. No hay manera de saber cuántos vectores 
habrá que calcular, y no se puede estar seguro de los valores límite de las entradas en x¿. 

El enfoque correcto es calcular el vector de estado estable y, luego, recurrir al teorema 
18. Dado P como en el ejemplo 2, se forma P — I restando 1 de cada entrada diagonal en P. 
Después se reduce por filas la matriz aumentada: 


0 ] = 


-.3 .1 .3 0 

.2 -.2 .3 0 

.1 .1 -.6 0 


Recuerde, de trabajos anteriores con decimales, que el cálculo se simplifica al multiplicar 
cada fila por 10. 1 


"-3 

1 

3 

0 


"1 

0 

-9/4 

0 ~ 

2 

-2 

3 

0 

~ 

0 

1 

-15/4 

0 

1 

1 

-6 

0 


0 

0 

0 

0 


La solución general de (P — /)x = 0 es X\ = Xo = J.Í 3 y x 3 es libre. Eligiendo x 3 = 4, 
se obtiene una base para el espacio solución cuyas entradas son enteros, y a partir de ello se 
encuentra fácilmente el vector de estado estable cuyas entradas suman 1 : 


9" 


9/28 ~ 


".32" 

15 

y q = 

15/28 


.54 

4 


4/28 


.14 


Las entradas en q describen la distribución de los votos en una elección que se celebrará den¬ 
tro de muchos años (suponiendo que la matriz estocástica continúa describiendo los cambios 
de una elección a otra). Así, finalmente, alrededor del 54% de los votos serán para el candida¬ 
to republicano. ■ 


1 Advertencia: No solo multiplique P por 10. En vez de ello, multiplique la matriz aumentada para la ecuación 
(P - I)x = 0 por 10. 
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IT U I n IN U IVI L r\ I L/ n 


Quizás haya notado que si x *+1 


Px k para k = 0, 1,... entonces 


x 2 = Px, = P(Px o) = P 2 x 0 , 


y, en general. 


x* = P k x 0 para k = 0, 1. 


Para calcular un vector específico, tal como X 3 , se necesitan menos operaciones arit¬ 
méticas para calcular x 1; x 2 y X 3 , más que P 3 y P 3 Xq. Sin embargo, si P es pequeña, 
por ejemplo, 30 x 30, el tiempo de cálculo de la máquina es insignificante con am¬ 
bos métodos, y tal vez se prefiera un comando para calcular P 3 Xo, ya que requiere 
teclear menos. 


PROBLEMAS DE PRÁCTICA 


1. Suponga que los habitantes de una región metropolitana se desplazan de acuerdo con las 
probabilidades de la matriz de migración M del ejemplo 1, y que se elige un residente “al 
azar”. Entonces, un vector de estado para un año determinado se puede interpretar como 
un indicador de las probabilidades de que la persona sea residente de la ciudad o de los 
suburbios en ese momento. 


a ) Suponga que la persona elegida es un residente de la ciudad ahora, de manera que 

1 


x 0 


0 


. ¿Cuál es la probabilidad de que esa persona viva en los suburbios el 


año próximo? 

b) ¿Cuál es la probabilidad de que esa persona viva en los suburbios en dos años? 


2. Sea P 


.6 .2 

.4 .8 


y q 


. ¿Es q un vector de estado estable para P? 


3. ¿Qué porcentaje de la población en el ejemplo 1 vivirá en los suburbios después de mu¬ 
chos años? 


4.9 EJERCICIOS 

1. Un pueblo remoto y pequeño recibe transmisiones de radio 
de dos estaciones radiofónicas: una de noticias y una emisora de 
música. De los oyentes que sintonizan la emisora de noticias, el 
70% seguirá escuchando las noticias después del corte de esta¬ 
ción que ocurre cada media hora, mientras que el 30% sintoni¬ 
zará la estación de música durante el corte de estación. De los 
oyentes que sintonizan la estación de música, el 60% cambiará 
a la estación de noticias en el corte de estación, mientras que el 
40% permanecerá escuchando la música. Suponga que todos los 
habitantes están escuchando las noticias a las 8:15 a.m. 

a) Dé la matriz estocástica que describe cómo los oyentes de 
radio tienden a cambiar las estaciones en cada corte de esta¬ 
ción. Rotule las filas y las columnas. 

b) Dé el vector de estado inicial. 

c) ¿Qué porcentaje de los oyentes estará escuchando la emi¬ 
sora de música a las 9:25 a.m. (después de los cortes de esta¬ 
ción de las 8:30 y de las 9:00 a.m.)? 

2. Un animal de laboratorio puede comer cualquiera de tres ali¬ 
mentos cada día. Los registros de laboratorio indican que si el 
animal elige un alimento en un ensayo, elegirá el mismo ali¬ 


mento en el siguiente ensayo con una probabilidad del 60%, y 
elegirá cualquiera de los otros alimentos en el siguiente ensayo 
con iguales probabilidades del 20 %. 

a) ¿Cuál es la matriz estocástica de esta situación? 

b) Si el animal elige el alimento #1 en un ensayo inicial, ¿cuál 
es la probabilidad de que elija el alimento #2 en el segundo 
ensayo después del inicial? 



3. En un día cualquiera, un estudiante está sano o enfermo. De los 
estudiantes que están sanos hoy, el 95% estarán sanos mañana. 
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De los estudiantes que están enfermos hoy, el 55% seguirán en¬ 
fermos mañana. 

a ) ¿Cuál es la matriz estocástica de esta situación? 

tí) Suponga que el 20% de los alumnos están enfermos el lunes. 
¿Qué fracción o porcentaje de los estudiantes es probable 
que estén enfermos el martes? ¿Y el miércoles? 

c) Si un estudiante está sano hoy, ¿cuál es la probabilidad de 
que esté sano dentro de dos días? 

4. El clima en Columbus es bueno, regular o malo en un día deter¬ 
minado. Si el clima es bueno hoy, hay un 40% de probabilidad 
de que sea bueno mañana, un 30% de probabilidad de que sea 
regular, y un 30% de que sea malo. Si el clima es regular hoy, 
existe un 50% de probabilidad de que sea bueno mañana, y un 
20% de probabilidad de que sea regular. Por último, si el clima 
es malo hoy, existe un 30% de probabilidad de que sea bueno 
mañana y un 40% de que sea regular. 

a) ¿Cuál es la matriz estocástica de esta situación? 
tí) Suponga que hay una probabilidad del 50% de buen clima 
hoy, y una probabilidad del 50% de clima regular. ¿Cuáles 
son las probabilidades de que el clima sea malo mañana? 
c) Suponga que, de acuerdo con los pronósticos para el lunes, 
hay un 60% de probabilidad de que el clima sea regular y 
un 40% de que sea malo. ¿Cuáles son las probabilidades de 
tener buen clima el miércoles? 


En los ejercicios 5 a 8, encuentre el vector de estado estable. 


5. 


.1 

.9 


.5 

.5 



.8 

.2 


7. 


.7 

.2 

.1 


.1 

.8 

.1 


.1 

.2 

.7 


8 . 


.4 

0 

.6 


.5 

.5 

0 


.8 

.1 

.1 


9. Determine si P 

10. Determine si P 


.2 

.8 

' 1 
0 


es una matriz estocástica regular, 
es una matriz estocástica regular. 


11. a) Encuentre el vector de estado estable para la cadena de 
Markov en el ejercicio 1. 

tí) En algún momento al final del día, ¿qué fracción de los 
oyentes escuchará las noticias? 


12. Consulte el ejercicio 2. ¿Qué alimento prefiere el animal des¬ 
pués de muchos ensayos? 


13. a) Encuentre el vector de estado estable para la cadena de 
Markov en el ejercicio 3. 

tí) ¿Cuál es la probabilidad de que, después de muchos días, un 
estudiante en particular esté enfermo? ¿Importa si esa perso¬ 
na está enferma hoy? 


14. Consulte el ejercicio 4. En el largo plazo, ¿qué tan probable es 
que el clima en Columbus sea bueno en un día determinado? 


15. [M] La Unidad de Investigación Demográfica del Departamento 
de Finanzas del Estado de California proporcionó los siguientes 
datos para la matriz de migración, la cual describe el movimien¬ 
to de la población de Estados Unidos durante 1989. En ese año. 


alrededor del 11.7% de la población total vivía en California. 
¿Qué porcentaje de la población total con el tiempo vivirá en 
California si las probabilidades de migración mencionadas se 
mantuvieran constantes durante muchos años? 

De: 

CA Resto de E.U.A. A: 

".9821 .0029] California 

.0179 .9971 Resto de E.U.A. 


16. [M] En Detroit, Hertz Rent A Car cuenta con una flota de 
cerca de 2000 automóviles. El patrón de puntos de alquiler 
y devolución de las unidades está descrito por las fracciones 
en la siguiente tabla. En un día típico, ¿cuántos autos estarán 
listos para rentarse en la sucursal ubicada en el centro de la 
ciudad? 


Autos rentados en: 


Aeropuerto 

Centro 

Apto, fuera 


de la cd. 

de cd. 

Devueltos en: 


'.90 

.01 

.09" 


Aeropuerto de la cd. 


.01 

.90 

.01 


Centro 


.09 

.09 

.90 


Apto, fuera de cd. 


17. Sea P una matriz estocástica de n x n. El siguiente argumento 
indica que la ecuación Px — x tiene una solución no trivial. (De 
hecho, una solución de estado estable existe con entradas no 
negativas. En algunos libros de texto avanzados se da una de¬ 
mostración). Justifique cada una de las siguientes afirmaciones. 
(Mencione un teorema cuando sea pertinente), 
a) Si todas las otras filas de P — 1 se suman a la fila de abajo, 
el resultado es una fila de ceros. 

tí) Las filas de P — I son linealmente dependientes. 

c) La dimensión del espacio fila de P — I es menor que n. 

d) P — 1 tiene un espacio nulo no trivial. 


18. Demuestre que toda matriz estocástica de 2 x 2 tiene al menos 
un vector de estado estable. Cualquier matriz de este tipo se 


puede representar en la forma P 


1 — a 
a 


P 

1-/3 


, donde 


ay ¡3 son constantes entre 0 y 1. (Hay dos vectores de estado 
estable, linealmente independientes, si a = /3 = 0. De lo con¬ 
trario, solo hay uno). 


19. Sea S una matriz fila de 1 x n con un 1 en cada columna, 

5= [1 1 1] 

a) Explique por qué un vector x en IR" es un vector de proba¬ 
bilidad si y solo si sus entradas son no negativas y Sx = 1. 
(Una matriz de 1 x 1 como el producto Sx generalmente se 
representa sin los símbolos de corchete de la matriz). 

b) Sea P una matriz estocástica de n x n. Explique por qué 
SP = S. 

c) Sea P una matriz estocástica de n x n, y sea x un vector 
de probabilidad. Demuestre que Px es también un vector de 
probabilidad. 


20. Con base en el ejercicio 19, demuestre que si P es una matriz 
estocástica de n x n, entonces también lo es P 2 . 
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21. [M] Examine las potencias de una matriz estocástica regular, 

a) Calcule P k para k — 2,3, 4, 5, cuando 


.3355 

.3682 

.3067 

.0389 

.2663 

.2723 

.3277 

.5451 

.1935 

.1502 

.1589 

.2395 

.2047 

.2093 

.2067 

.1765 


Presente los cálculos con cuatro decimales. ¿Qué ocurre a 
las columnas de P k conforme k aumenta? Calcule el vector 
de estado estable para P. 

b) Calcule Q k para k = 10, 20,..., 80, cuando 


.97 

.05 

0 

.90 

.03 

.05 


.10 

.05 

.85 


(La estabilidad de Q k con cuatro decimales puede requerir 
k = 116 o más). Calcule el vector de estado estable para Q. 


Haga una conjetura sobre lo que podría ser cierto para cual¬ 
quier matriz estocástica regular. 

c) Con base en el teorema 18, explique lo que encontró en los 
incisos a) y b). 

22. [M] Compare dos métodos para encontrar el vector de estado 
estable q de una matriz estocástica regular P: 1. calculando q 
como en el ejemplo 5, o 2. calculando P k para un valor grande 
de k y utilizando una de las columnas de P k como una aproxima¬ 
ción para q. [La Guía de estudio describe un programa de base 
nula que casi automatiza el método 1], 

Experimente con las matrices aleatorias estocásticas más gran¬ 
des que su programa de matrices le permita, y utilice k— 100 o 
algún otro valor grande. Para cada método, describa el tiempo 
que usted necesita para teclear y ejecutar su programa. (Algu¬ 
nas versiones de MATLAB tienen los comandos f lops y tic 
... toe que registran el número de operaciones de punto flotante 
y el tiempo total transcurrido que utiliza MATLAB). Compare las 
ventajas de cada método y determine cuál prefiere. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. a) Como el 5% de los residentes de la ciudad se mudará a los suburbios en menos de 
un año, hay una probabilidad del 5% de elegir a esa persona. Sin profundizar en el 
conocimiento acerca del individuo, se dice que hay un 5% de probabilidad de que este 
se mude a los suburbios. Este hecho se encuentra en la segunda entrada del vector de 
estado xi, donde 



'.95 

.03' 

' r 


'.95' 

X! = Mx 0 = 

.05 

.97 

0 

— 

.05 


b) La probabilidad de que la persona viva en los suburbios después de dos años es del 
9.6%, porque 



'.95 

.03' 

'.95' 


'.904' 

x 2 = Mx i = 

.05 

.97 

.05 

— 

.096 


2. El vector de estado estable satisface Px = x. Como 





llegamos a la conclusión de que q no es el vector de estado estable para P. 

3. M en el ejemplo 1 es una matriz estocástica regular, ya que sus entradas son estricta¬ 
mente positivas. Así que podemos utilizar el teorema 18. Ya conocemos el vector de es¬ 
tado estable del ejemplo 4. Por lo tanto, los vectores de distribución de la población xi¡ 
convergen en 


WEB 


q = 


.375 

.625 


Al final, el 62.5% de la población vivirá en los suburbios. 


CAPÍTULO 4 EJERCICIOS COMPLEMENTARIOS 


1. Marque cada enunciado como verdadero o falso. Justifique sus 
respuestas. (Si es verdadero, cite hechos o teoremas pertinentes. 
Si es falso, explique por qué o dé un contraejemplo que muestre 
por qué el enunciado no es cierto en todos los casos). En los 


incisos a) a/). Vi,..., x p son vectores en un espacio vectorial V 
con dimensión finita diferente de cero, y 5 = {vi,..., v,,}. 

a) El conjunto de todas las combinaciones lineales de vi,..., x p 
es un espacio vectorial. 
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b ) Si ¡Vi,..., Vp-i} genera a V, entonces S genera a V. 

c) Si ¡vi,..., Vp-i} es linealmente independiente, también S lo es. 

d) Si S es linealmente independiente, entonces S es una base 
para V. 

e) Si Gen S = V, entonces algún subconjunto de S es una 
base para V. 

/) Si dim V = p y Gen S = V, entonces S no puede ser lineal¬ 
mente dependiente. 

g ) Un plano en IR 3 es un subespacio de dimensión 2. 

h) Las columnas de una matriz que no son pivote siempre son 
linealmente dependientes. 

i) Las operaciones de fila en una matriz A pueden cambiar las 
relaciones de dependencia lineal entre las filas de A. 

j ) Las operaciones de fila en una matriz pueden cambiar el es¬ 
pacio nulo. 

k) El rango de una matriz es igual al número de filas diferentes 
de cero. 


l ) Si una matriz A de m x n es equivalente por filas a una matriz 
escalonada U,ysiU tiene k filas diferentes de cero, entonces 
la dimensión del espacio solución de Ax = 0 es m — k. 

m) Si B se obtiene a partir de una matriz A con varias operacio¬ 
nes elementales de fila, entonces rango B = rango A. 

n ) Las filas diferentes de cero de una matriz A forman una base 
para Fila A. 

o) Si las matrices Ay B tienen la misma forma escalonada re¬ 
ducida, entonces Fila A = Fila B. 

p) Si H es un subespacio de IR 3 , entonces hay una matriz A de 
3 x 3 tal que H = Col A. 

q) Si A es m x n y rango A = m, entonces la transformación 
lineal x i-> Ax es uno a uno. 

r ) Si A es de m x n y la transformación lineal x Ax es sobre, 
entonces rango A = m. 

s) Una matriz de cambio de coordenadas siempre es invertible. 

t) Si B = {bi,..., b„j y C— {ci,..., c„) son bases para un es¬ 
pacio vectorial V , entonces la y-ésima columna de la matriz 
de cambio de coordenadas de la matriz P es el vector de 
coordenadas [c ; ] fí . 

2. Encuentre una base para el conjunto de todos los vectores de la 

forma 


a — 2b + 5c 
2a + 5b — 8 c 
—a — Ab + 1c 
3 a + b + c 


. (Tenga cuidado) 




"- 2 ~ 


1 _ 


b 1 

3. Sean 

Ui = 

4 

, u 2 = 

2 

, b = 

b 2 



-6 


-5 


b 2 


y 


W = Gen {ui, u^j. Encuentre una descripción implícita de W, 
es decir, encuentre un conjunto de una o más ecuaciones homo¬ 
géneas que caracterizan a los puntos de W. [Sugerencia: Pre¬ 
gúntese cuándo está b en W]. 


4. Explique lo que está mal en el siguiente análisis: Sea f(í) = 3 + 
t y g(f) = 3í + t 2 , y note que g(f) = íf(í). Entonces, [f, gj es 
linealmente dependiente, porque g es un múltiplo de f. 


5. Considere los polinomios pi(í) = 1 + í, pjff) = 1 - f, P3(f) = 
4, P 4 (í) = t + f 2 , y P 5 (t) = 1 + 2í + f 2 , y sea H el subespacio 
de P 5 generado por el conjunto S = {pi, P2, P3, P4, ps¡. Utilice 


el método descrito en la demostración del teorema del conjunto 
generador (sección 4.3) con la finalidad de obtener una base para 
H. (Explique cómo seleccionar los miembros adecuados de S). 

6 . Suponga que pi, P 2 , P 3 , P 4 son polinomios específicos que ge¬ 
neran un subespacio H de dimensión 2 de IP 5 . Describa cómo 
se puede encontrar una base para H mediante el examen de los 
cuatro polinomios y sin hacer casi ningún cálculo. 

7. ¿Qué tendría que saber acerca del conjunto solución de un siste¬ 
ma homogéneo de 18 ecuaciones lineales con 20 variables con 
la finalidad de determinar que cada ecuación no homogénea 
asociada tiene una solución? Analice. 

8 . Sea H un subespacio de dimensión n de un espacio vectorial V 
de dimensión n. Explique por qué H = V. 

9. Sea T : R" —» R™ una transformación lineal. 

a) ¿Cuál es la dimensión del rango de T si T es un mapeo uno a 
uno? Explique su respuesta. 

b) ¿Cuál es la dimensión del núcleo de T (véase la sección 4.2) 
si T mapea R" sobre R' n ? Explique su respuesta. 

10. Sea S un subconjunto maximal linealmente independiente de un 
espacio vectorial V. Es decir, S tiene la propiedad de que si 
un vector que no está en S se adjunta a 5, entonces el nuevo con¬ 
junto ya no será linealmente independiente. Demuestre que S 
debe ser una base para V. [Sugerencia: Pregúntese qué pasa si 
S es linealmente independiente, pero no una base de V], 

11. Sea S un conjunto generador mínimo finito de un espacio vecto¬ 
rial V. Es decir, S tiene la propiedad de que si un vector se elimi¬ 
na de S, entonces el nuevo conjunto ya no genera a V. Demuestre 
que S debe ser una base para V. 

Los ejercicios 12 a 17 desarrollan las propiedades del rango que a 

veces son necesarias en las aplicaciones. Suponga que la matriz A 

es de m x n. 

12. A partir de los incisos a) y b) demuestre que el rango AB no 
puede exceder al rango de A o al rango de B. (En general, el 
rango de un producto de matrices no puede exceder el rango 
de cualquier otro factor en el producto). 

a) Demuestre que si B es de n x p, entonces rango AB ^ ran¬ 
go A. [Sugerencia: Explique por qué cada vector en el es¬ 
pacio columna de AB está en el espacio columna de A]. 

b ) Demuestre que si B es n x p, entonces rango AB £ 
rango B. [Sugerencia: Tome en cuenta el inciso a) para 
estudiar el rango de (A fí) 7 j. 

13. Demuestre que si P es una matriz invertible de m x m, entonces 
el rango PA = rango A. [Sugerencia: Aplique el ejercicio 12 
■dPAyP '(PA)\. 

14. Demuestre que si Q es invertible, entonces rango AQ = ran¬ 
go A. [Sugerencia: Tome en cuenta el ejercicio 13 para estu¬ 
diar el rango de [AQ) T ], 

15. Sea A una matriz de m x n, y B una matriz de n x p tales que 
AB = 0. Demuestre que rango A + rango B £ n. [Sugerencia: 
Considere que uno de los cuatro subespacios Nul A, Col A, Nul 
B y Col B se encuentra en uno de los otros tres subespacios]. 

16. Si A es una matriz de m x n de rango r, entonces la factoriza- 
ción de rango de A es una ecuación de la forma A = CR, donde 
C es una matriz de/nxr de rango r, y R es una matriz derxn 
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de rango r. Tal factorización siempre existe (ejercicio 38 en la 
sección 4.6). Dadas dos matrices A y B de m x n, utilice facto- 
rizaciones de rango de A y B para demostrar que 
rango (A + B) £ rango A + rango B 

[Sugerencia: Escríba A + B como el producto de dos matrices 
particionadas], 

17. Una submatriz de una matriz A es cualquier matriz que re¬ 
sulta de la eliminación de algunas filas y/o columnas (o de nin¬ 
guna) de A. Es posible demostrar que A tiene rango r si y solo 
si A contiene una submatriz invertible de r x r y ninguna sub¬ 
matriz cuadrada mayor es invertible. Demuestre parte de este 
enunciado explicando: a) por qué una matriz A de m x/iy ran¬ 
go r tiene una submatriz Ai de m x ry rango r, y b) por qué 
Ai tiene una submatriz invertible At de r x r. 

El concepto de rango desempeña un papel importante en el diseño de 
sistemas de control de ingeniería, como el sistema del transbordador 
espacial mencionado en el ejemplo introductorio de este capítulo. Un 
modelo de espacios de estado de un sistema de control incluye una 
ecuación en diferencias de la forma 

x*+i = Ax + Su* para k = 0, 1,... (1) 

donde A es de n x n, B es de n x m, {x*} es una secuencia de 
“vectores de estado” en IR" que describe el estado del sistema en 
tiempos discretos, y {«*} es una secuencia de control o de entrada. 
Se dice que el par (A, B) es controlable si 

rango [B AB A 2 B ■■■ A n i B] = n (2) 

La matriz que aparece en la ecuación (2) se llama matriz de contro- 
labilidad del sistema. Si (A, B) es controlable, entonces el sistema 
se puede controlar, o conducir del estado 0 a cualquier estado espe¬ 
cificado v (en IR") en un máximo de n pasos, simplemente eligiendo 
una secuencia de control adecuada en IR'". Este hecho se ilustra en 
el ejercicio 18 para n = 4 y m = 2. Para un análisis adicional de la 


capacidad de control, visite el sitio Web de este libro (estudio de caso 
del capítulo 4). 

I WEB I 


18. Suponga que A es una matriz de 4 x 4 y B es una matriz de 
4 x 2, y sea que Uo,..., U 3 representen una secuencia de vec¬ 
tores de entrada en IR 2 . 

a) Establezca xo = 0, calcule xi,..., X 4 a partir de la ecua¬ 
ción ( 1 ), y escriba una fórmula para X 4 que implique a la 
matriz de controlabilidad M que aparece en la ecuación (2). 
(Nota: La matriz M se construye como una matriz particio- 
nada; su tamaño total aquí es 4 x 8 ). 

b) Suponga que (A, B) es controlable y v es cualquier vector 
en IR 4 . Explique por qué existe una secuencia de control 
Uq,.•U3 en IR 2 tal que X 4 = v. 


Determine si los pares de matrices de los ejercicios 19 a 22 son con¬ 
trolables. 



'.9 

1 0“ 


"0~ 

19. A = 

0 

-.9 0 

, B = 

1 


0 

0 .5 _ 


1 


'.8 

-.3 0“ 


' 1 ' 

20. A = 

.2 

.5 1 

, B = 

1 


0 

0 —.5 _ 


0 



0 1 

0 




0 0 

1 


21. [M] A = 

0 0 

0 




—2 -4.2 -4.8 - 



0 1 

0 




0 0 

1 


22. [M] A = 

0 0 

0 




-1 -13 

-12.2 - 




Valores propios y 
vectores propios 


EJEMPLO INTRODUCTORIO 

Sistemas dinámicos y 
búhos manchados 

En 1990 el búho manchado norteño se convirtió en el centro 
de una controversia nacional sobre el uso y el mal uso de los 
majestuosos bosques en el Pacífico Noroccidental de Estados 
Unidos. Los ambientalistas convencieron al gobierno federal 
de que el búho estaría en riesgo de extinción si continuaba la 
tala en los antiguos bosques (con árboles de más de 200 años 
de edad), donde el búho prefiere vivir. La industria maderera, 
anticipando la pérdida de 30,000 a 100,000 puestos de trabajo 
como resultado de las nuevas restricciones gubernamentales 
sobre la tala, argumentó que el búho no debería estar 
clasificado como “especie amenazada” y citó diferentes 
reportes científicos publicados para apoyar su caso. 1 

En medio del fuego cruzado entre los grupos antagónicos, 
los ecologistas matemáticos intensificaron su afán de compren¬ 
der la dinámica poblacional del búho. El ciclo de vida de un 
búho manchado se divide naturalmente en tres etapas: juvenil 
(hasta un año de edad), subadulto (de 1 a 2 años) y adulto (más 
de 2 años). Los búhos se aparean de por vida en las etapas de 
subadulto y adulto, y empiezan a criar cuando son adultos. 
Viven alrededor de 20 años y cada pareja requiere aproxima¬ 
damente 1000 hectáreas (4 millas cuadradas) como su propio 
territorio. Un tiempo fundamental en el ciclo de vida es cuando 
los búhos juveniles dejan el nido. Para sobrevivir y convertirse 
en un subadulto, un búho juvenil debe tener éxito para encon¬ 
trar un nuevo territorio para vivir (y en general, una pareja). 


1 “The Great Spotted Owl War”, Reader’s Digest, noviembre de 1992. 
pp. 91-95. 



Un primer paso en el estudio de la dinámica poblacional 
consiste en modelar la población a intervalos anuales, en tiem¬ 
pos que se denotan con k = 0, 1, 2,... En general, se supone 
que hay una relación 1:1 de machos a hembras en cada etapa 
del ciclo de vida y se cuentan solamente las hembras. 

La población en cada año k se describe con un vector 

Xk = (jb Ok), donde jk, Sk y úk son los números de hembras 

en las etapas juvenil, subadulto y adulto, respectivamente. 

Utilizando datos reales de estudios demográficos, R. 
Lamberson y sus colaboradores consideraron el siguiente 
modelo matricialpor etapas: 2 


jk +1 


0 

0 

.33" 

jk 

Sk+1 

= 

.18 

0 

0 

Sk 

CLk +1 


0 

.71 

.94 

a k 


Aquí, el número de nuevas hembras juveniles en el año 
k + 1 es .33 veces el número de hembras adultas en el año k 
(según la tasa promedio de nacimientos por pareja de búhos). 
Asimismo, 18% de los búhos juveniles sobreviven para con¬ 
vertirse en subadultos, en tanto que 71% de los subadultos y 
94% de los adultos sobreviven para contarse como adultos. 

El modelo matricial por etapas es una ecuación en 
diferencias de la forma Xk i i = Ax¡,. A esta ecuación con 
frecuencia se le llama sistema dinámico (o sistema 


2 R. H. Lamberson, R. McKelvey, B. R. Noon y C. Voss, “A Dynamic Ana- 
lysis of the Viability of the Northern Spotted Owl in a Fragmented Forest 
Environment”, Conservation Biology 6 (1992), pp. 505-512. También, una 
comunicación privada del profesor Lamberson, 1993. 
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dinámico lineal discreto), ya que describe los cambios en 
un sistema conforme transcurre el tiempo. 

La tasa de sobrevivencia del 18% de búhos juveniles 
en la matriz por etapas de Lamberson es la entrada más 
afectada por la cantidad de bosque antiguo disponible. 

En realidad, el 60% de los búhos juveniles normalmente 
sobreviven para dejar el nido, pero en la región de Willow 
Creek, California, estudiada por Lamberson y sus 
colaboradores, tan solo al 30% de los búhos juveniles que 
dejaron el nido les fue posible encontrar un nuevo territorio 
para vivir. Los restantes perecieron durante la búsqueda. 


Un motivo significativo para el fracaso de los búhos 
en encontrar nuevas áreas de distribución es el aumento en 
la fragmentación de las áreas con árboles antiguos, debido a la 
tala total de áreas dispersas en terrenos con árboles antiguos. 
Cuando un búho sale de la región protectora del bosque y 
cruza un área talada, aumenta drásticamente el riesgo de 
sufrir un ataque por parte de los depredadores. En la sección 
5.6 se mostrará que el modelo descrito predice la eventual 
extinción de búhos, pero que si el 50% de los búhos juveniles 
que sobreviven al dejar el nido también encuentran nuevas 
áreas de distribución, entonces se salvaría su población. 


| WEB | 


El objetivo de este capítulo es descomponer la acción de una transformación lineal x >—» Ax en 
elementos que sean de fácil visualización. Excepto por un breve paréntesis en la sección 5.4, 
en este capítulo todas las matrices son cuadradas. Las principales aplicaciones descritas aquí 
son para sistemas dinámicos discretos, incluyendo el ya mencionado asunto de los búhos 
manchados. Sin embargo, los conceptos básicos, vectores propios y valores propios, son úti¬ 
les en matemáticas puras y aplicadas, y se presentan en situaciones más generales que las que 
aquí se consideran. Los valores propios también sirven para estudiar ecuaciones diferenciales 
y sistemas dinámicos continuos , brindan información crítica en diseños de ingeniería, y se 
originan de manera natural en campos de la física y la química. 


5.1 VECTORES PROPIOS Y VALORES PROPIOS 


No obstante que una transformación x >—» Ax puede mover vectores en diversas direcciones, 
a menudo sucede que hay vectores especiales sobre los cuales la acción de A es bastante 
simple. 


EJEMPLO 1 


Sean A = 



. En la figura 1 se muestran 


las imágenes de u y v bajo la multiplicación por A. En efecto, A\ es precisamente 2v. Así, 
A tan solo “estira” o dilata a v. ■ 



FIGURA 1 Efectos de la multiplicación por A. 

Como otro ejemplo, los lectores de la sección 4.9 recordarán que si A es una matriz 
estocástica, entonces el vector de estado estable q para A satisface la ecuación Ax = x. 
Es decir, Aq = 1 • q. 
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Esta sección estudia ecuaciones tales como 

Ax = 2x o bien Ax = —4x 

donde los vectores especiales son transformados por A en múltiplos escalares de sí mismos. 


DEFINICION Un vector propio de una matriz A de n x n es un vector distinto de cero x tal que 
Ax = Ax para algún escalar A. Un escalar A es un valor propio de A si existe una so¬ 
lución no trivial x de Ax = Ax; tal x es el vector propio correspondiente a A. 1 


Es fácil determinar si un vector dado es un vector propio de una matriz. También es sen¬ 
cillo decidir si cierto escalar es un valor propio. 


Au 

20- 

- 


\\ Av 



i i i 

V | 

1 1 

i i i 

-30 

-10- 

1 

u 

1 1 

30 

-20- 

- 



Au = —4u, pero Av # Av. 


EJEMPLO 2 

propios de A? 


Sean 


' 1 6' 


6 ' 


3' 


5 2 

, u = 

-5 

y v = 

-2 

. ¿Son u y v vectores 


SOLUCIÓN 


r i 6i 

6" 


'-24 

i 

<N 

LO 

_1 

-5 


20 

' 1 6" 

3' 


'-9' 

5 2 

-2 


11 






= — 4u 


Entonces, u es un vector propio correspondiente a un valor propio (—4), pero v no es un 
vector propio de A porque Av no es múltiplo de v. ■ 


EJEMPLO 3 Demuestre que 7 es un valor propio de la matriz A del ejemplo 2, y deter¬ 
mine los vectores propios correspondientes. 

SOLUCIÓN El escalar 7 es un valor propio de A, si y solo si la ecuación 

Ax = 7x (1) 

tiene una solución no trivial. No obstante, la ecuación (1) es equivalente a Ax — 7x = 0, 
o bien. 


(A - 7/)x = 0 (2) 

Para resolver esta ecuación homogénea, forme la matriz 


r i 6i 


r? 

ol 


r-6 

61 

i 

<N 

LD 

_1 


o 
_1 

<1 
i_ 


LO 

_1 

1 

Ul 

1_ 


Como es evidente, las columnas de A — 7/ son linealmente dependientes, de manera que la 
ecuación (2) tiene soluciones no triviales. Por lo tanto, 7 es un valor propio de A. Para encon¬ 
trar los vectores propios correspondientes, utilice operaciones de fila: 


1 

6 

o] 


O 

7 

L 5 

-5 

1 

O 


o o oj 


La solución general tiene la forma Xi 


. Cada vector de esta forma con xi A 0 es un vector 


propio correspondiente a A 


= 7. 


1 Advierta que. por definición, un vector propio debe ser distinto de cero, pero un valor propio puede ser cero. 
Después del ejemplo 5, se analizará el caso donde el número 0 es un valor propio. 
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Advertencia: No obstante que en el ejemplo 3 se utilizó reducción por filas para encon¬ 
trar vectores propios, este método no se puede emplear para determinar valores propios. 
En general, una forma escalonada de una matriz A no presenta los valores propios de A. 

Evidentemente, la equivalencia de las ecuaciones (1) y (2) es válida para cualquier A 
en vez de A = 7. Entonces, A es un valor propio de la matriz A de n x n si y solo si la 
ecuación 


{A - A/)x = 0 (3) 

tiene una solución no trivial. El conjunto de todas las soluciones de (3) es justo el espacio 
nulo de la matriz de A — A/. Así que este conjunto es un subespacio de IR" y se denomina 
el espacio propio de A correspondiente a A. El espacio propio consiste en el vector cero y 
de todos los vectores propios correspondientes a A. 

El ejemplo 3 demuestra que para la matriz A del ejemplo 2, el espacio propio corres¬ 
pondiente a A = 7 consiste en todos los múltiplos de (1, 1), que es la recta que pasa tanto por 
(1. 1) como por el origen. Con el ejemplo 2, se comprueba que el espacio propio asociado 
con A = —4 es la recta que pasa por (6, —5). En la figura 2, se presentan esos espacios pro¬ 
pios, junto con los vectores propios (1, 1) y (3/2, —5/4) y la acción geométrica de la trans¬ 
formación x ^Ax sobre cada espacio propio. 


<N / 

/ 

/ 

/ 

<r~ - " 

- Multiplicación ^ •>- 
por 7,'' / 

/ 

/ 

/ / 

/ Espacio propio 

! para X = 1 

\/ 

i i i i i i i i i 

1111Ts111 

l l l l l l l l l 

Multiplicación 

_ 2 

por -4 

x Espacio propio 

/ 

para X = -4 


~ NÍ6, -5) 




FIGURA 2 Espacios propios para A = —4 y A = 7. 


EJEMPLO 4 


Sea A 


4 

2 

2 


-1 

1 

-1 


6 

6 

8 


. Un valor propio de A 


es 2. Determine una base 


para el espacio propio correspondiente. 


SOLUCIÓN Forme 



4-1 6 


"2 0 0" 


2-1 6 

A-21 = 

2 1 6 

— 

0 2 0 

= 

2-1 6 


2-1 8 


0 0 2 


2-1 6 


y reduzca por filas la matriz aumentada para (A — 2/)x = 0: 


O 

so 

7 

<N 


"2 -1 6 0" 

2-160 


0 0 0 0 

1- 

N> 

OS 

O 

1_ 


1 

O 

O 

o 

o 
_1 
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En este punto, resulta claro que 2 es un valor propio de A porque la ecuación (A - 2 1)x = 0 
tiene variables libres. La solución general es: 


Xi 

x2 

= X 2 

"1/2" 

1 

+ x 3 

"-3 

0 

, x 2 y x 3 son libres 

x 3 


0 


1 



El espacio propio, que se muestra en la figura 3, es un subespacio bidimensional de R 3 . 
Una base es 





FIGURA 3 A actúa como una dilatación sobre el espacio propio. 


- NOTA NUMÉRICA - 

El ejemplo 4 es un buen método para el cálculo manual de vectores propios en casos 
simples donde se conoce un valor propio. En general, se recomienda el uso de un 
programa matricial y la reducción por filas para encontrar un espacio propio (para 
un valor propio dado), aunque no es totalmente confiable. Ocasionalmente, el error 
por redondeo lleva a una forma escalonada reducida con el número de pivotes equi¬ 
vocado. Los mejores programas computacionales calculan simultáneamente aproxima¬ 
ciones para los valores propios y los vectores propios, con el grado de exactitud que 
se requiera, en matrices que no son muy grandes. El tamaño de las matrices que se 
logra analizar se incrementa cada año conforme mejora la potencia computacional 
y la eficiencia del software. 


El siguiente teorema describe uno de los pocos casos especiales donde los valores pro¬ 
pios se pueden determinar con precisión. En la sección 5.2 también se analizará el cálculo de 
valores propios. 


Los valores propios de una matriz triangular son las entradas sobre su diagonal 
principal. 


TEOREMA 1 
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CAPITULO 5 


Valores propios y vectores propios 


TEOREMA 2 


DEMOSTRACIÓN Por sencillez, considere el caso 3 x 3. Si A es triangular superior, en¬ 
tonces, A — A/ tiene la forma 



«11 

«12 

«13 


A 0 

0" 

A-XI = 

0 

a 22 

«23 

- 

0 A 

0 


0 

0 

«33 _ 


1 

O 

O 

A 


a 11 - 

A 

«12 


«13 


= 

0 


«22 — A 

«23 



0 


0 

1 

1 

en 

<3 



El escalar A es un valor propio de A si y solo si la ecuación (A - A/)x = 0 tiene una solu¬ 
ción no trivial, es decir, si y solo si la ecuación tiene una variable libre. Gracias a las entra¬ 
das cero en A - A/, es fácil ver que (A - A/)x = 0 tiene una variable libre si y solo si al 
menos una de las entradas sobre la diagonal de A - A/ es cero. Esto ocurre si y solo si A 
es igual a una de las entradas «n, a. 22 , «33 en A. Véase el ejercicio 28 para el caso donde 
A es triangular inferior. ■ 


EJEMPLO 5 Sean A = 

"3 

0 

6 -8 

0 6 

y b = 

4 0 

-2 1 

0 " 

0 


0 

0 2 


5 3 

4 


. Los valores propios 


de A son 3, 0 y 2. Los valores propios de B son 4 y 1. 


¿Qué significa para una matriz A tener un valor propio de 0, tal como en el ejemplo 5? 
Esto ocurre si y solo si la ecuación 

Ax = Ox (4) 

tiene una solución no trivial. Pero la ecuación (4) es equivalente a Ax = 0, que tiene una so¬ 
lución no trivial si y solo si A no es invertible. Entonces, 0 es un valor propio de A si y solo si A 
no es invertible. En la sección 5.2 este hecho se agregará al teorema de la matriz invertible. 

El siguiente teorema importante se necesitará más adelante. Su demostración muestra 
un cálculo típico con vectores propios. 


Si Vi,..., v r son vectores propios que corresponden a distintos valores propios 
Ai,..., A,, de una matriz A de n x n. entonces el conjunto {vi,..., v,} es linealmente 
independiente. 


DEMOSTRACIÓN Suponga que {vi,..., v,} es linealmente dependiente. Puesto que vi es 
diferente de cero, el teorema 7 de la sección 1.7 indica que uno de los vectores en el con¬ 
junto es una combinación lineal de los vectores precedentes. Sea p el índice mínimo tal que 
Vp+i sea una combinación lineal de los vectores precedentes (linealmente independientes). 
Entonces, existen escalares ci,..., c p tales que 

dvi + ••• + Cp\ p = Vp+i (5) 

Multiplicando por A ambos miembros de la ecuación (5) y considerando el hecho de que 
Av,t = A¿v* para cada k, 

CiAvi H-1- c p A\ p = A \ p+ 1 

C1A1V1 "b ''' “b CpXpYp — A^-i-iVp+i 

Multiplicando por A ;)+ 1 ambos lados de la ecuación (5) y restando el resultado de (6), 

G(A 1 Ap-j-i)vi ~b ••• ~b c p (A p X p+ i)v ¿7 — 0 ( 7 ) 

Puesto que {v¡,_, v /; ¡ es linealmente independiente, todos los pesos en la ecuación (7) son 

iguales a cero. Sin embargo, ninguno de los factores A, - A ; ,, 1 son cero, ya que los valores 
propios son distintos. Por lo tanto, c, = 0 para i = l,...,p. No obstante, la ecuación (5) indica 
que Vp+i = 0, lo cual es imposible. En consecuencia, {vi,..., v, ¡ no puede ser linealmente 
dependiente y, por consiguiente, debe ser linealmente independiente. ■ 
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Vectores propios y ecuaciones en diferencias 

Esta sección concluye con la demostración cómo construir soluciones de la ecuación en dife¬ 
rencias de primer orden analizada en el ejemplo introductorio del capítulo: 

x k+1 =Ax k (k = 0,1,2,...) (8) 

Si A es una matriz de n x n, entonces la ecuación (8) es una descripción recursiva de una 
secuencia {x*} en R". Una solución de la ecuación (8) es una descripción explícita de [ x¡ ; ¡, 
cuya fórmula para cada no depende directamente de A ni de los términos precedentes en la 
secuencia, excepto del término inicial xo. 

La forma más sencilla de construir una solución de la ecuación (8) es tomar un vector 
propio xo y su correspondiente valor propio A, y hacer 

x k = X k x 0 (k = 1,2,...) (9) 

Esta secuencia es una solución, ya que 

Ax k = A( X k x 0 ) = A k (Ax 0 ) = X k (Ax 0 ) = A í + 1 x 0 = x k+l 

Combinaciones lineales de soluciones en la forma de la ecuación (9) ¡también son soluciones! 
Véase el ejercicio 33. 


PROBLEMAS DE PRÁCTICA 


1. ¿Es 5 un valor propio de A 


6 -3 1 

3 0 5 ? 

2 2 6 


2. Si x es un vector propio de A correspondiente a A, ¿qué ocurre con A 3 x? 

3. Suponga que bi y b 2 son vectores propios correspondientes a distintos valores propios 
Ai y A 2 , respectivamente, y también que b 3 y b 4 son vectores propios linealmente inde¬ 
pendientes asociados a un tercer valor propio A 3 distinto. ¿Necesariamente se deduce que 
{bi, b 2 , bi, bit} es un conjunto linealmente independiente? [Sugerencia: Considere la 
ecuación cibi + C2b2 + fobs + 04b 4) = 0], 


5.1 EJERCICIOS 





ll 



1 ~ 

-2 





1. 

¿Es A = 2 un valor propio de 

3 8 

? ¿Por qué? 

6 . ¿Es 

un vector propio de 

ó 

3 

2 

7 








2 


5 

6 

4 

2 . 

¿Es A = —3 un valor propio de 

-1 

6 

4 

9 

? ¿Por qué? 

encuentre el valor propio. 












r 

3 

0 

-n 


3. ¿Es 


un vector propio de 


1 -1 
6 -4 


? Si lo es, encuentre 


el valor propio. 


7. ¿Es A = 4 un valor propio de 

determine un vector propio correspondiente. 


2 3 1 

-3 4 5 









4 

-2 

31 

4 . ¿Es 

"-1 ' 
1 

un vector propio de 

1 i 

en 

2 " 

6 

? Si así es, deter- 

8. ¿Es A = 1 un valor propio de 

0 

-1 

-1 

2 

1 

m <n 

1 


? Si lo es. 


? Si es así. 


? Si es así. 


mine el valor propio. 


determine un vector propio correspondiente. 



3" 


'-4 3 3" 


5. ¿Es 

-2 

1 

un vector propio de 

2 -3 -2 

-1 0 -2 

? En caso 


afirmativo, determine el valor propio. 


En los ejercicios 9 a 16, determine una base para el espacio propio 
asociado con cada valor propio indicado. 


9. 




1, 3 
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10 . 

11 . 

12 . 


13. 


14. 


15. 


16. 


A = 

A = 

A = 

A = 

A = 

A = 

A = 



X = -5 


, X = -1,7 


A = 3, 7 


0 1 
1 0 
0 !. 

0 -1 
0 3 

-2 5 

1 f 
-3 2 

3 -2 


A = 1,2, 3 


, A = 3 


A = -5 


0-1 0 
3 0 0 

-13 0 

-2 -2 4 


A = 4 


En los ejercicios 17 y 18, determine los valores propios de las 
matrices. 


17. 


19. 


'0 

0 

0" 


5 

0 

0' 

0 

3 

4 

18. 

0 

0 

0 

0 

0 

-2 


-1 

0 

3 


Para A = 


1 2 3 
1 2 3 
1 2 3 


encuentre un valor propio, sin rea- 


20 . 


lizar cálculos. Justifique su respuesta. 

Sin hacer cálculos, obtenga un valor propio y dos vectores 


propios linealmente independientes de A = 


2 

2 

2 


2 

2 

2 


2 

2 

2 


Justifique su respuesta. 

En los ejercicios 21 y 22, A es una matriz de n x n. Marque cada 
enunciado como verdadero o falso. Justifique su respuesta. 


21. a) Si Ax = Ax para algún vector x, entonces A es un valor 
propio de A. 

b) Una matriz A no es invertible si y solo si 0 es un valor pro¬ 
pio de A. 

c) Un número c es un valor propio de A si y solo si la ecuación 
(A - cl)x = 0 tiene una solución no trivial. 

d) Quizá sea difícil obtener un vector propio de A. pero es 
sencillo comprobar si un vector dado es, de hecho, un vec¬ 
tor propio. 

e) Para determinar los valores propios de A, se reduce A a una 
forma escalonada. 


22. a) Si Ax = Ax para algún escalar A, entonces x es un vector 
propio de A. 

b) Si Vi y \2 son vectores propios linealmente independientes, 
entonces corresponden a distintos valores propios. 


c) Un vector de estado estable para una matriz estocástica es 
realmente un vector propio. 

d) Los valores propios de una matriz están sobre su diagonal 
principal. 

e) Un espacio propio de A es el espacio nulo de cierta matriz. 

23 . Explique por qué una matriz de 2 x 2 puede tener, cuando mu¬ 
cho, dos valores propios distintos. También indique por qué una 
matriz de n x n puede tener, cuando mucho, n valores propios 
diferentes. 

24. Construya un ejemplo de una matriz de 2 x 2 con tan solo un 
valor propio distinto. 

25 . Sea A un valor propio de una matriz A invertible. Demuestre 
que A -1 es un valor propio de A -1 . [ Sugerencia: Suponga que x 
distinto de cero satisface Ax = Ax]. 

26 . Demuestre que si A 2 es la matriz cero, entonces el único valor 
propio de A es 0. 

27 . Demuestre que A es un valor propio de A si y solo si A es un 
valor propio de A T . [Sugerencia: Determine cómo se relaciona 
A - XI con A T — XI]. 

28 . Utilice el ejercicio 27 para completar la demostración del teore¬ 
ma 1 para el caso en que A es triangular inferior. 

29 . Considere una matriz A de n x n con la propiedad de que la suma 
de las filas sea igual al mismo número i. Demuestre que í es un 
valor propio de A. [Sugerencia: Encuentre un vector propio], 

30 . Considere una matriz A de n x n tal que las sumas de columnas 
sean iguales al mismo número s. Demuestre que s es un valor 
propio de A. [Sugerencia: Utilice los ejercicios 27 y 29]. 

En los ejercicios 31 y 32, sea A la matriz de la transformación lineal 
T. Sin escribir A, encuentre un valor propio de A y describa el espacio 
propio. 

31. T es la transformación sobre IR 2 que refleja los puntos con res¬ 
pecto a una recta que pasa por el origen. 

32. T es la transformación en IR 3 que gira los puntos alrededor de 
alguna recta que pasa por el origen. 

33. Sean u y v vectores propios de una matriz A, con valores propios 
correspondientes A y /x, y sean c\ y C 2 escalares. Defina: 

ií k = C\X k n + C 2 lJi k y (A: = 0,1,2,...) 

a) ¿Qué es x¿+i por definición? 

b) Calcule Ax k de la fórmula para x k y demuestre que 
Ax k = Xjt + i Este cálculo probará que la secuencia {x*} 
que se acaba de definir satisface la ecuación en diferen¬ 
cias xt+i = Ax¡ t (k = 0, 1, 2,...). 

34. Describa cómo intentaría construir una solución de una ecuación 
en diferencias x¿ + i = Ax k (k = 0,1,2,...), si le dieran xo inicial y 
resultara que este no fuera un vector propio de A. [Sugerencia: 
¿Cómo podría relacionar xo con los vectores propios de A?] 

35 . Sean u y v los vectores que se muestran en la figura, y supon¬ 
ga que u y v son vectores propios de una matriz A de 2 x 2 
correspondientes a los valores propios 2 y 3, respectivamente. 
Sea T : R 2 —» IR 2 la transformación lineal dada por T(x) = Ax 
para cada x en IR 2 , y sea w = u + v. Haga una copia de la figura. 
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y sobre el mismo sistema de coordenadas grafique cuidadosa¬ 
mente los vectores TTu), T(v) y T( w). 


v 


36. Repita el ejercicio 35, suponiendo que u y v son vectores 
propios de A correspondientes a los valores propios —1 y 3, 
respectivamente. 

[M] En los ejercicios 37 a 40. utilice un programa matricial para de¬ 
terminar los valores propios de la matriz. Después, aplique el método 
del ejemplo 4 con una rutina de reducción por filas para producir una 
base para cada espacio propio. 


37. 



12 

-90 

30 

30 

30" 


8 

-49 

15 

15 

15 


16 

-52 

12 

0 

20 


0 

-30 

10 

22 

10 


8 

-41 

15 

15 

7 _ 


-23 

57 

-9 

-15 

-59 

-10 

12 

-10 

2 

-22 

11 

5 

-3 

-19 

-15 

-27 

31 

-27 

25 

-37 

-5 

-15 

-5 

1 

31 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. El número 5 es un valor propio de A si y solo si la ecuación (A — 5/)x = 0 tiene una so¬ 
lución no trivial. Forme 



"6 

-3 

r 


"5 

0 

0 


' 1 

-3 

r 

A-51 = 

3 

0 

5 

— 

0 

5 

0 

= 

3 

-5 

5 


2 

2 

6 


0 

0 

5 


2 

2 

1 


y reduzca por filas la matriz aumentada: 


1 

-3 

1 

0 


" 1 

-3 

1 

0 


■ 1 

-3 

1 

0" 

3 

-5 

5 

0 

~ 

0 

4 

2 

0 

~ 

0 

4 

2 

0 

2 

2 

1 

0 


0 

8 

-1 

0 


0 

0 

-5 

0 


En este punto, es evidente que el sistema homogéneo no tiene variables libres. Entonces, 
A — 51 es una matriz invertible, lo cual significa que 5 no es un valor propio de A. 

2. Si x es un vector propio de A correspondiente a A, entonces Ax = Ax y 

A 2 x = A(Ax) = A Ax = A 2 x 


Otra vez, A 3 x = A(A 2 x) = A(A 2 x) = A 2 Ax = A 3 x. El patrón general, A k x = \ k x, se 
demuestra por inducción. 

3. Sí. Suponga que cibi + C 2 b 2 + c^bs + C 4 b 4 = 0. Puesto que cualquier combinación li¬ 
neal de vectores propios del mismo valor propio es otra vez un vector propio para ese 
valor propio, C 3 b 3 + C 4 b 4 es un vector propio para A 3 . De acuerdo con el teorema 2, los 
vectores bi, b 2 y C 3 b 3 + C 4 b 4 son linealmente independientes, de manera que 

cibi + c 2 b 2 + (c 3 b 3 + c 4 b 4 ) = 0 

implica que cq = C 2 = 0. Pero, C 3 y C 4 también deben ser cero porque b 3 y b 4 son lineal¬ 
mente independientes. Por lo tanto, todos los coeficientes en la ecuación original deben 
ser iguales a cero, y los vectores bi, b 2 , b 3 y b 4 son linealmente independientes. 


5.2 LA ECUACIÓN CARACTERÍSTICA 


Información útil acerca de los valores propios de una matriz cuadrada A está codificada en 
una ecuación escalar especial llamada ecuación característica de A. Un simple ejemplo nos 
llevará al caso general. 
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EJEMPLO 1 Determine los valores propios de A 


2 

3 


3 

-6 


SOLUCIÓN Deben obtenerse todos los escalares A tales que la ecuación matricial 

(A - A/)x = 0 

tenga una solución no trivial. De acuerdo con el teorema de la matriz invertible de la sec¬ 
ción 2.3, este problema es equivalente a encontrar todas las A tales que la matriz de A — A/ 
no sea invertible, donde 


'2 3" 


’A 

0 ' 


" 2 — A 3 

3 -6 


0 

A 


3 -6-A 


De acuerdo con el teorema 4 de la sección 2.2, esta matriz no es invertible precisamente 
cuando su determinante es cero. De manera que los valores propios de A son las soluciones 
de la ecuación 


Recuerde que 


Entonces, 


det(A — XI) 


det 


2-A 
3 


3 

—6 — X 


= 0 


det 


b 

d 


= ad — be 


det (A - XI) = (2 - A) (—6 - A) - (3)(3) 
= -12 + 6A-2A + A 2 -9 
= A 2 + 4A-21 
= (A - 3)(A + 7) 


Si det(A — XI) = 0, entonces A = 3, o bien, A = —7. Por lo tanto, los valores propios de A 
son 3 y —1. ■ 

El determinante en el ejemplo 1 transformó la ecuación matricial (A — A/)x = 0, que 
implica dos incógnitas (A y x), en la ecuación escalar A 2 + 4A — 21 =0, que tan solo im¬ 
plica una incógnita. La misma idea funciona para matrices de n x n. Sin embargo, antes de pa¬ 
sar a matrices más grandes, se resumen las propiedades necesarias de los determinantes para 
estudiar valores propios. 


Determinantes 

Sean A una matriz de n x n, y U una forma escalonada de A obtenida mediante remplazos 
e intercambios de fila (sin escalamiento), y sea r el número de tales intercambios de fila. 
Entonces, el determinante de A, que se escribe det A, es (—1)' veces el producto de las 
entradas diagonales «n„.., u ml en U. Si A es invertible, todas la entradas Mu,..., u nn son 
pivotes (porque A ~ /„ y las m,-,- no se escalaron a 1). Es decir, al menos u nn es cero y el 
producto m n ••• u nn es cero. Así, 1 


, 

í (-1)'' * 

( producto de\ 


det A = \ 

cuando A es invertible 

ypivotes en UJ ’ 


[o. 


cuando A no es invertible 


1 La fórmula (1) se dedujo en la sección 3.2. Los lectores que no hayan estudiado el capítulo 3 pueden emplear esta 
fórmula como la definición de det A. Es un hecho notable y no trivial que cualquier forma escalonada U obtenida 
de A sin escalar dé el mismo valor para det A. 
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EJEMPLO 2 


Calcule det A para A = 


1 

2 

0 


5 

4 

-2 


0 

-1 

0 


SOLUCIÓN La siguiente reducción por filas utiliza un intercambio de filas: 


■ 1 

5 

0 " 


"1 

5 

0 


" 1 

5 

0 " 

0 

-6 

-1 


0 

-2 

0 


0 

-2 

0 

0 

-2 

0 


0 

-6 

-1 


0 

0 

-1 


De manera que det A = (—1) 1 (1)(—2)(— 1) = —2. La siguiente reducción por filas alterna¬ 
tiva evita el intercambio de filas y produce una forma escalonada diferente. El último paso 
suma —1/3 por la fila 2 a la fila 3: 


■ 1 

5 

0 


' 1 

5 

0 

0 

-6 

-1 


0 

-6 

-1 

0 

-2 

0 


0 

0 

!/3_ 


Esta vez, det A es (—1)°(1)(—6)(l/3) = — 2, igual que antes. ■ 

La fórmula (1) para el determinante muestra que A es invertible si y solo si det A es 
distinto de cero. Este hecho, y la caracterización de invertibilidad establecida en la sección 
5.1, se agregan al teorema de la matriz invertible. 


TEOREMA 



FIGURA 1 


El teorema de la matriz invertible (continuación) 

Sea A una matriz de n x n. Entonces, A es invertible si y solo si: 

s) El número 0 no es un valor propio de A. 

t) El determinante de A no es cero. 


Cuando A es una matriz de 3 x 3, |det A\ resulta ser el volumen del paralelepípedo de¬ 
finido por las columnas a t , a 2 , 83 de A, como se muestra en la figura 1. (Para más detalles, 
véase la sección 3.3). Este volumen es distinto de cero si y solo si los vectores a¡, a 2 , 83 
son linealmente independientes, en cuyo caso la matriz A es invertible. (Si los vectores son 
distintos de cero y linealmente dependientes, entonces se encuentran sobre un plano o sobre 
una recta). 

El siguiente teorema lista los resultados, que se necesitarán, de las secciones 3.1 y 3.2. 
Aquí se incluye el inciso a) como una referencia conveniente. 


TEOREMA 3 Propiedades de los determinantes 

Sean AyB matrices de n x n. 

a) A es invertible si y solo si det A A 0. 

b) det (AB) = (det A)(det B). 

c ) det A T = det A. 

d) Si A es triangular, entonces det A es el producto de las entradas sobre la diagonal 
principal de A. 

e) La operación de remplazo de filas sobre A no cambia el determinante. Un inter¬ 
cambio de filas cambia el signo del determinante. Un escalamiento de filas también 
escala al determinante por el mismo factor de escala. 
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La ecuación característica 

El teorema 3a) demuestra cómo determinar cuando una matriz de la forma A — XI no es 
invertible. La ecuación escalar dct(,4 — A/) = 0 es la ecuación característica de A, y el 
argumento en el ejemplo 1 justifica el siguiente hecho. 


Un escalar A es un valor propio de una matriz A de n x n si y solo si A satisface la 
ecuación característica 

det(A - A/) = 0 


EJEMPLO 3 Encuentre la ecuación característica de 

"5-2 6-1 

0 3-8 0 

A ~ 0 0 5 4 

0 0 0 1 


SOLUCIÓN Forme A — A/y utilice el teorema 3 d): 


5-A 
0 
0 
0 


det(A — A I) = det 

= (5 — A)(3 — A)(5 — A)(l — A) 


-2 
3 — A 
0 
0 


5-A 
0 


-1 

0 

4 

1 - A 


La ecuación característica es 

(5 — A) 2 (3 — A)(l — A) = 0 


o bien, 


(A - 5) 2 (A - 3)(A - 1) = 0 

Desarrollando el producto, se escribe 

A 4 — 14A 3 + 68A 2 — 130A + 75 = 0 ■ 

En los ejemplos 1 y 3, det(A — A/) es un polinomio en A. Se puede demostrar que si A 
es una matriz de n x n, entonces det(A — A I) es un polinomio de grado n llamado polinomio 

característico de A. 

El valor propio 5, en el ejemplo 3, tiene multiplicidad 2 porque (A — 5) ocurre dos veces 
como factor del polinomio característico. En general, la multiplicidad (algebraica) de un 
valor propio A es su multiplicidad como una raíz de la ecuación característica. 

EJEMPLO 4 El polinomio característico de una matriz de 6 x 6 es A 6 - 4A 5 - 12A 4 . De¬ 
termine los valores propios y sus multiplicidades. 

SOLUCIÓN Factorice el polinomio 

A 6 - 4A 5 - 12A 4 = A 4 (A 2 - 4A - 12) = A 4 (A - 6)(A + 2) 


Los valores propios son 0 (multiplicidad 4), 6 (multiplicidad 1) y —2 (multiplicidad 1). ■ 
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TEOREMA 4 


Se podrían listar los valores propios del ejemplo 4 como 0, 0, 0, 0, 6 y —2, de modo 
que los valores propios están repetidos de acuerdo con sus multiplicidades. 

Puesto que la ecuación característica para una matriz de n x n implica un polinomio 
de grado n, la ecuación tiene exactamente n raíces, contando las multiplicidades, si se per¬ 
miten raíces complejas. En la sección 5.5 se analizarán dichas raíces complejas, llamadas 
valores propios complejos. Hasta entonces, solo se considerarán valores propios reales, y los 
escalares continuarán siendo números reales. 

La ecuación característica es importante para fines teóricos. Sin embargo, en el trabajo 
práctico, los valores propios de una matriz más grande que 2x2 deberían encontrarse usando 
una computadora, a menos que la matriz sea triangular o tenga otras propiedades especiales. 
No obstante que un polinomio característico 3 x 3 es fácil de calcular a mano, quizá sea di¬ 
fícil factorizarlo (a menos que la matriz sea cuidadosamente seleccionada). Véase las “Notas 
numéricas’’ del final de esta sección. 


Similitud 

El siguiente teorema ilustra un uso del polinomio característico, y brinda un fundamento 
para varios métodos iterativos que aproximan valores propios. Si A y B son matrices de 
n x n, entonces A es similar a B si hay una matriz invertible P tal que P~ l AP = B, o bien, 
de manera equivalente, A = PBP~ l . Escribiendo Q para P se tiene Q l BQ = A. Así, 
B es también similar a A, y se dice simplemente que Ay B son similares. Cambiar A por 
P 1 AP es una transformación de similitud. 


Si las matrices Ay B de n x n son similares, entonces tienen el mismo polinomio carac¬ 
terístico y, por lo tanto, los mismos valores propios (con las mismas multiplicidades). 


DEMOSTRACIÓN Si B = P l AP, entonces, 

B -XI = P~ l AP-XP~ l P = P~ x (AP-XP) = P~ l (A — XI)P 

Utilizando la propiedad multiplicativa b) del teorema 3, se calcula 

det(5 - XI) = det[L >_1 (A - XI)P] 

= det(L >_1 ) • det(A — XI) ■ det(jP) ( 2 ) 

Puesto que det(.P _1 ) • det(,P) = det(/ )_1 / ) ) = det / = 1, de la ecuación (2) se observa que 
det(fí - XI) = det(A - XI). ■ 


ADVERTENCIAS: 

1. Las matrices 


2 

1 


i 

0 

0 

2 

y 

0 

2 


no son similares a pesar de tener los mismos valores propios. 

2. Similitud no es lo mismo que equivalencia por filas. (Si A es equivalente por filas 
a B , entonces B = EA para alguna matriz E invertible). En general, las operaciones 
con filas sobre una matriz cambian sus valores propios. 
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CAPITULO 5 


Valores propios y vectores propios 


Aplicación a sistemas dinámicos 

Los valores propios y vectores propios tienen la clave para la evolución discreta de un sistema 
dinámico, como se mencionó en la introducción al capítulo. 


EJEMPLO 5 


Sea A = 


.95 

.05 


.03 

.97 


. Analice 


el comportamiento a largo plazo del 


sistema dinámico definido por x k .¡ l 


Ax k (k = 0, 1, 2,...), con xq = 


.6 

.4 


SOLUCIÓN El primer paso consiste en determinar los valores propios de A y una base para 
cada espacio propio. La ecuación característica de A es 


0 = det 


95-A 
.05 


.03 

97-A 


= A 2 - 1.92A + .92 


(.95 - A)(.97 - A) - (.03)(.05) 


Por la fórmula cuadrática, 


1.92 ± y(L92) 2 - 4(.92) 1.92 ± >/A)064 


1.92 ± .08 


1 o bien .92 


Es rápido comprobar que los vectores propios correspondientes a A = 1 y A = 0.92 son múl¬ 
tiplos de 


vi 


y v 2 


respectivamente. 

El siguiente paso es escribir xo dada, en términos de v¡ y v 2 . Esto se puede hacer porque 
{vi, v 2 } evidentemente es una base para IR 2 . (¿Por qué?) De manera que existen pesos y c 2 
tales que 


Xo = CiVi -I- C 2 V 2 = [V! V 2 ] 


c 1 

C 2 


(3) 


De hecho. 


Ci 

r i- 1 

'3 

1' 

-1 

r.óoi 

_C 2 _ 

= [ Vi V 2 ] X 0 = 

5 

-1 


i 

o 

_i 


r-i -ii 

r -6oi 


'.125' 

i— 

l 

Lh 

1_ 

i— 

o 


.225 


(4) 


Cada x¿ es fácil de calcular, ya que V| y v 2 en la ecuación (3) son vectores propios de A, con 
Avi = vi y Av 2 = .92v 2 : 


Utilizando linealidad de x | — * Ax, 
Vi y v 2 son vectores propios. 


xi = Ax 0 = CiAvi + c 2 Av 2 
= civi + c 2 (.92)v 2 
x 2 = Axi = ciAvi + c 2 (.92)Av 2 
= CiVi + c 2 (.92) 2 v 2 
y así sucesivamente. En general, 

xa- = civi + c 2 (. 92) k \ 2 (k = 0,1,2,...) 

Utilizando y c 2 de la ecuación (4), 

+ 225(.92) k 


xa = .125 


(k = 0 . 1 , 2 ,...) 


(5) 
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Esta fórmula explícita para x* da la solución de la ecuación en diferencias x^+i = Ax k . 
Conforme k —> (.92/' tiende a cero y x¿ tiende a 

Los cálculos del ejemplo 5 tienen una aplicación interesante a las cadenas de Markov 
analizadas en la sección 4.9. Quienes hayan leído esa sección reconocerán que la matriz A 
del ejemplo 5 anterior es la misma que la matriz M de migración de la sección 4.9, que xo 
es la distribución de población inicial entre la ciudad y los suburbios, y que x* representa la 
distribución de población después de k años. 

El teorema 18 de la sección 4.9 estableció que para una matriz tal como A, la secuencia x k 
tiende a un vector de estado estable. Ahora se sabe por qué las x¿ se comportan de esa forma, 
al menos para la matriz de migración. El vector de estado estable es ,125vi, un múltiplo del 
vector propio vi, y la fórmula (5) para x¡¡ muestra precisamente por qué x k —» ,125vi. 


.375 

.625 


= ,125vi 


- NOTAS NUMÉRICAS - 

1. El software computacional como Mathematica y Maple utilizan cálculos simbóli¬ 
cos para encontrar el polinomio característico de una matriz de tamaño moderado. 
Pero no hay una fórmula o un algoritmo finito para resolver la ecuación caracterís¬ 
tica de una matriz general de n x n para n > 5. 

2. Los mejores métodos numéricos para encontrar valores propios evitan totalmente 
el polinomio característico. En efecto, MATLAB determina el polinomio carac¬ 
terístico de una matriz A calculando primero los valores propios Ai,...,A„ de A y, 
luego, desarrollando el producto (A — Ai)(A — A 2 )...(A — A„). 

3. Varios algoritmos comunes para estimar los valores propios de una matriz A se 
basan en el teorema 4. En los ejercicios se analiza el poderoso algoritmo QR. 
Otra técnica, llamada método de Jacobi, funciona cuando A = A T y calcula una 
secuencia de matrices de la forma 

Ai = A y A k+l = P k l A k P k (k = 1,2,...) 

Cada matriz en la secuencia es similar a A y así tiene los mismos valores propios 
que A. Las entradas no diagonales de A k+ 1 tienden a cero conforme aumenta k, y 
las entradas diagonales se van aproximando a los valores propios de A. 

4. En la sección 5.8 se analizan otros métodos para calcular valores propios. 


PROBLEMA DE PRÁCTICA 

Encuentre la ecuación característica y los valores propios de A = 


5.2 EJERCICIOS 


En los ejercicios 1 a 8, encuentre el polinomio característico y los 
valores propios reales de las matrices dadas. 




-2 

5 


1 . 


2 

7 


7 

2 





3 

1 


3. 


-4 

6 


2 

7 



2 

3 


Los ejercicios 9 a 14 requieren las técnicas de la sección 3.1. De¬ 
termine el polinomio característico de cada matriz, utilizando un 
desarrollo por cofactores o la fórmula especial para determinantes 
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de 3 x 3 descrita antes de los ejercicios 15 a 18 de la sección 3.1. 
[Nota: Mediante operaciones de filas no es sencillo encontrar el po¬ 
linomio característico de una matriz de 3 x 3, porque está implicada 
la variable A], 



'4 

0 

-1 " 



3 

1 

1' 

9. 

0 

4 

-1 


10. 

0 

5 

0 


1 

0 

2 



-2 

0 

7 _ 


'3 

0 

0" 



'-1 

0 

2" 

11. 

2 

1 

4 


12. 

3 

1 

0 


1 

0 

4 



0 

1 

2 


6 

—2 

0 



4 

0 

-1" 

13. 

-2 

9 

0 

14. 

-1 

0 

4 


5 

8 

3 

J 


0 

2 

3 


Para las matrices de los ejercicios 15 a 17, liste los valores propios 
reales, repetidos de acuerdo con su multiplicidad. 


5 

5 

0 

2" 

1 


'3 

0 

0 

0' 

0 

2 

-3 

6 

1 

6 

2 

0 

0 

0 

0 

3 

-2 

lo. 

0 

3 

6 

0 

0 

0 

0 

5 _ 



2 

3 

3 

-5 

3 

0 

0 

0 

1 0 " 






-5 

1 

0 

0 

1 0 






3 

8 

0 

0 

1 0 






0 

-7 

2 

1 

0 






-4 

1 

9 

-2 

3 







18. Se puede demostrar que la multiplicidad algebraica de un valor 
propio A es siempre mayor o igual que la dimensión del espacio 
propio correspondiente a A. Determine h en la matriz A de aba¬ 
jo, tal que el espacio propio para A = 4 sea bidimensional: 


4 2 3 3 

0 2/? 3 

0 0 4 14 

0 0 0 2 


19. Sea A una matriz de n x n y suponga que A tiene n valores 
propios reales, Ai,..., A„, repetidos de acuerdo con sus multipli¬ 
cidades, tal que 


22. a ) Si A es 3 x 3, con columnas ai, ai, 83 , entonces det A es igual 
al volumen del paralelepípedo formado por ai, a 2 , 83 . 

b) det A T = (—1) det A. 

c) La multiplicidad de una raíz r de la ecuación característica 
de A se llama multiplicidad algebraica de r como un valor 
propio de A. 

d) Una operación de remplazo por filas sobre A no altera sus 
valores propios. 


Un método ampliamente utilizado para estimar los valores pro¬ 
pios de una matriz general A es el algoritmo QR. En condicio¬ 
nes adecuadas, este algoritmo produce una secuencia de matri¬ 
ces, todas similares a A, casi triangulares superiores, con entradas 
diagonales que aproximan los valores propios de A. La idea princi¬ 
pal es factorizar A (u otra matriz similar a A) en la forma A = Q\R\, 
donde Q\ r = Qi 1 y R 1 es triangular superior. Los factores se inter¬ 
cambian para formar Ai = R\Q\, que se factoriza de nuevo como 
Ai = QtRi, entonces, se forma A 2 = RdQi, y así sucesivamente. La 
similitud de A, Ai,... se deduce del resultado más general del ejer¬ 
cicio 23. 


23. Demuestre que si A = QR con Q invertible, entonces A es simi¬ 
lar a Ai = RQ. 

24. Demuestre que si A y 5 son similares, entonces det A = det B. 


25. Sean A = 


.6 

.4 


Vi = 


3/7 

4/7 


y x 0 = 


. [Nota: A es 


la matriz estocástica estudiada en el ejemplo 5 de la sec¬ 
ción 4.9]. 

a) Encuentre una base para que consiste en Vi y otro vector 
propio V 2 de A. 

b) Compruebe que xo se escribe en la forma Xq = vi + CV 2 . 

c) Para k = 1,2,.... defina x* = A k x 0 . Calcule xi y X 2 , y escriba 
una fórmula para x*. Después, demuestre que x* —» vi con¬ 
forme k aumenta. 


26. Sea A = 


. Utilice la fórmula (1) para un determi- 


a b 
c d 

nante (dada antes del ejemplo 2) para demostrar que 
det A = ad — be. Considere dos casos: a # 0 y a = 0. 


det (A - XI) = (A, - A)(A 2 — A) • • • (A„ - A) 

Explique por qué det A es el producto de los n valores propios 
de A. (Este resultado es válido para cualquier matriz cuadrada 
cuando se consideran valores propios complejos). 

20. Utilice una propiedad de determinantes para demostrar que A y 
A T tienen el mismo polinomio característico. 

En los ejercicios 21 y 22, Ay B son matrices de n x n. Indique si 
cada enunciado es verdadero o falso. Justifique cada respuesta. 

21. a) El determinante de A es el producto de las entradas diagona¬ 

les en A. 

b) Una operación de filas elemental sobre A no cambia el valor 
del determinante. 

c) (det A)(det B) — detAB 

d) Si A + 5 es un factor del polinomio característico de A, en¬ 
tonces 5 es un valor propio de A. 



'.5 

.2 

.3" 


~ .3 ~ 


1 ' 

27. Sean A = 

.3 

.8 

.3 

, Vi = 

.6 

, v 2 = 

-3 


.2 

0 

.4 


.1 


2 



'-1" 


■ 1 ■ 

V 3 = 

0 

yw = 

1 


1 


1 


a) Demuestre que vi, v 2 , V3 son vectores propios de A. 
[Nota: A es la matriz estocástica estudiada en el ejemplo 3 
de la sección 4.9]. 

b) Sea xo cualquier vector en R 3 con entradas no negativas 
cuya suma sea 1. (En la sección 4.9, a xo se llamó vector de 
probabilidad). Explique por qué existen constantes ci, c 2 , C 3 
tales que xq = CiVi + c 2 v 2 + C3V3. Calcule w r xo, y deduz¬ 
ca que C\ — 1. 

c) Para k = 1,2,..., defina x¿ = A k x o, con xo como en el in¬ 
ciso b). Demuestre que x¿ —> vi cuando k aumenta. 
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28. [M] Construya una matriz A de 4 x 4, valuada en los enteros, y 
compruebe que A y A T tienen el mismo polinomio característico 
(los mismos valores propios con las mismas multiplicidades). 
¿A y A T tienen los mismos vectores propios? Realice el mismo 
análisis con una matriz de 5 x 5. Escriba las matrices y sus con¬ 
clusiones. 

29. [M] Construya una matriz A de 4 x 4 valuada en los enteros. 

a) Reduzca A a una forma escalonada U sin emplear escala¬ 
miento por filas, y utilice U en la fórmula (1) (que está antes 
del ejemplo 2) para calcular det A. (Si A resulta ser singular, 
entonces inicie con una nueva matriz aleatoria). 

fe) Determine los valores propios de A y el producto de esos 
valores propios (tan exactamente como sea posible). 


c) Escriba la matriz A y, con cuatro lugares decimales, liste los 
pivotes en U y los valores propios de A. Calcule det A con su 
programa matricial, y compárelo con los productos encon¬ 
trados en los incisos a) y fe). 


30. [M] Sea A = 



28 

-15 

a 


21 

-12 

25 


Para cada valor de a en 


el conjunto {32, 31.9, 31.8, 32.1, 32.2), calcule el polinomio 
característico de A y los valores propios. En cada caso, trace 
una gráfica del polinomio característico p(t) = det(A — ti) para 
0 £ t £ 3. Si es posible, elabore todas las gráficas sobre un 
mismo sistema de coordenadas. Describa cómo las gráficas re¬ 
velan los cambios en los valores propios conforme a cambia. 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 

La ecuación característica es 

0 = det(A — XI) = det ^ ^ 9 ^ ^ 

= (1 - A)(2 - A) - (—4)(4) = A 2 - 3A + 18 
De la fórmula cuadrática, 

l _ 3± v/(—3) 2 - 4(18) _ 3 ± 7=63 
2 2 

Es evidente que la ecuación característica no tiene soluciones reales, así que A no tiene 
valores propios reales. La matriz A está actuando sobre el espacio vectorial real R 2 , y ahí no 
existe un vector v distinto de cero, tal que Av = Av para algún escalar A. 


5.3 DIAGONALIZACIÓN 


En muchos casos, la información valor propio-vector propio contenida en una matriz A se 
presenta en una factorización útil de la forma A = PDP 1 donde I) es una matriz diagonal. 
En esta sección, la factorización permite calcular rápidamente las potencias A k para valores 
grandes de k: una idea fundamental en varias aplicaciones del álgebra lineal. Posteriormente, 
en las secciones 5.6 y 5.7, se utilizará la factorización para analizar (y desacoplar ) sistemas 
dinámicos. 

El siguiente ejemplo muestra que las potencias de una matriz diagonal son fáciles de 
calcular. 


EJEMPLO 1 Si D = 

y 

D 3 = DD 2 


r\2 

'5 

0' 

'5 

0' 


" 5 2 

0' 

, entonces, D = 

0 

3 

0 

3 _ 


0 

32 . 


rs 

0 " 

" 5 2 

0 ' 


" 5 3 

0 ' 

1 — 

0 

3 _ 

0 

32 _ 


0 

3 3 


En general, 


D k = 


'5 k 
0 


0 

3 k 


para A > 1 


Si A = PDP 1 para alguna P invertible con D diagonal, entonces A k es también fácil de 
calcular, como lo demuestra el siguiente ejemplo. 
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TEOREMA 5 


EJEMPLO 2 Sea A = 


. Encuentre una fórmula para A k , dado que A = PDP 1 , 


donde 



0 

3 


SOLUCIÓN La fórmula estándar para la inversa de una matriz de 2 x 2 da 



Entonces, por asociatividad de la multiplicación matricial. 


A 2 = (PDP -i )(PDP - ') = PD(P -1 P) DP 


= PDDP -1 


= PD 2 P -1 


i r 

" 5 2 

0 ' 

r 2 n 

-1 -2 

0 

3 2 

i 

7 

7 


Nuevamente, 


(PDP -1 ) A 2 = (PDP -1 )PD 2 P -1 


PDir P 


PD 3 P -1 


En general, para k > 1, 


A k = PD k P -1 


i r 

" 5 a ’ 

0 ' 

2 r 

-1 -2 

_ 0 

3 a '_ 

-i -i 


2- 5 k — 3 k 5 k - 3 k 
2 • 3* - 2 • 5 a ' 2 • 3 a — 5 k 


Una matriz cuadrada A es diagonalizable si A es similar a una matriz diagonal, es decir, 
si A = PDP 1 para alguna matriz P invertible y alguna matriz D diagonal. El siguiente teo¬ 
rema da una caracterización de matrices diagonalizables e indica cómo construir una factori- 
zación conveniente. 


Teorema de diagonalización 

Una matriz A de n x n es diagonalizable, si y solo si A tiene n vectores propios lineal¬ 
mente independientes. 

En efecto, A = PDP -1 , con D como matriz diagonal, si y solo si las columnas de 
P son n vectores propios linealmente independientes de A. En este caso, las entradas 
diagonales de D son valores propios de A que corresponden, respectivamente, a los 
vectores propios en P. 


En otras palabras, A es diagonalizable si y solo si hay suficientes vectores propios para 
formar una base de R". Tal base es una base de vectores propios de R". 

DEMOSTRACIÓN Primero, observe que si P es cualquier matriz de n x n con columnas 
Vi,..., v„, y si D es cualquier matriz diagonal con entradas diagonales Ai,..., A,„ entonces, 


AP = A[\ i v 2 

mientras que 


PD = P 


Ai 

0 


0 

a 2 


o o 


v„ ] = [ A \i 4 v 2 • • • A\„ ] 


0 

0 


— [ AiVi A 2 v 2 


A 


n 


A„v„ ] 


( 1 ) 


( 2 ) 
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Ahora suponga que A es diagonalizable y A = PDP Por lo tanto, esta relación se mul¬ 
tiplica por la derecha por P y se obtiene AP = PD. En este caso, las ecuaciones (1) y (2) 
implican que 


[Ay i A\ 2 ■■■ Av„] = [livi A 2 v 2 ••• A„v„ ] (3) 

Igualando columnas, 

Ax i = AiVi, Ax 2 = A 2 v 2 . A\ n = A„v„ (4) 

Puesto que P es invertible, sus columnas Vi,..., v„ deben ser linealmente independientes. 
Asimismo, como esas columnas no son cero, entonces las ecuaciones en (4) muestran que 
Ai,..., A„ son valores propios y vi,..., v,¡ son los vectores propios correspondientes. Este 
argumento demuestra las partes “solo si” del primer y segundo enunciados, junto con el ter¬ 
cer enunciado, del teorema. 

Por último, dados cualesquiera n vectores propios Vi,..., v,¡, úselos para construir las 
columnas de P y utilice los valores propios correspondientes Ai,..., A„ para formar D. Por 
las ecuaciones (1) a (3), AP = PD. Esto es válido sin condiciones sobre los vectores pro¬ 
pios. Si, en efecto, los vectores propios son linealmente independientes, entonces P es in¬ 
vertible (según el teorema de la matriz invertible), y AP = PD implica que A = PDP *. ■ 


Diagonalización de matrices 

EJEMPLO 3 Diagonalice la siguiente matriz, si es posible. 


A = 


1 3 3 

-3 -5 -3 
3 3 1 


Es decir, encuentre una matriz P invertible y una matriz D diagonal tales que A = PDP 1 
SOLUCIÓN Hay cuatro pasos para implementar la descripción en el teorema 5. 


Paso 1. Determine los valores propios de A. Como se mencionó en la sección 5.2, la mecá¬ 
nica de este paso es adecuada para una computadora, cuando la matriz es mayor que 2x2. 
Para eliminar distracciones innecesarias, el texto generalmente dará información adicional de 
utilidad para este paso. En el presente caso, la ecuación característica implica un polinomio 
cúbico que se factoriza como: 


0 = det (A - XI) = -A 3 - 3A 2 + 4 

= -(A - l)(A + 2) 2 


Los valores propios son A = lyA = —2. 


Paso 2. Encuentre tres vectores propios de A linealmente independientes. Se necesitan tres 
vectores porque A es una matriz de 3 x 3. Este es el paso crítico. Si falla, entonces el teore¬ 
ma 5 indica que A no se puede diagonalizar. El método de la sección 5.1 produce una base 
para cada espacio propio: 


Base para A = 1: Vi 


1 

-1 

1 




~-l ' 


~-i~ 

Base para A = —2: 

v 2 = 

1 

0 

y v 3 = 

0 

1 


Puede comprobar que {vi, v 2 , V 3 } es un conjunto linealmente independiente. 
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Paso 3. Construya P con los vectores del paso 2. No es importante el orden de los vectores. 
Utilizando el orden seleccionado en el paso 2, forme 


P = [ Vl v 2 v 3 ] 



Paso 4. Construya D con los valores propios correspondientes. En este paso, resulta esen¬ 
cial que el orden de los valores propios coincida con el orden elegido para las columnas 
de P. Utilice dos veces el valor propio A = — 2, uno para cada vector propio correspondiente 
a A = -2: 



Es buena idea comprobar que P y D realmente funcionen. Para evitar el cálculo de P~ l , 
simplemente compruebe que AP = PD. Esto es equivalente a A = PDF 1 cuando P es in¬ 
vertible. (Sin embargo, ¡asegúrese que P sea invertible!) Calcule 



EJEMPLO 4 Si es posible, diagonalice la siguiente matriz. 



SOLUCION La ecuación característica de A resulta ser exactamente la misma que en el 
ejemplo 3: 

0 = det (A - XI) = -A 3 - 3A 2 + 4 = -(A - 1)(A + 2) 2 


Los valores propios son A = 1 y A = —2. No obstante, es fácil comprobar que cada espacio 
propio es tan solo unidimensional: 


Base para A = 1: Vi 



Base para A = — 2: v 2 



No existen más valores propios, en tanto que cada vector propio de A es un múltiplo de vi 
o de v 2 . Por consiguiente, es imposible construir una base de IR 3 utilizando vectores propios 
de A. De acuerdo con el teorema 5, Ano es diagonalizable. ■ 

El siguiente teorema proporciona una condición suficiente para que una matriz sea 
diagonalizable. 


TEOREMA 6 


Una matriz de n x n con n valores propios distintos es diagonalizable. 
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TEOREMA 7 


DEMOSTRACION Sean Vi,..., v„ los vectores propios correspondientes a los n valores 

propios diferentes de una matriz A. Entonces, {vi,_, v„¡ es linealmente independiente, 

de acuerdo con el teorema 2 de la sección 5.1. Por lo tanto, A es diagonalizable, según el 
teorema 5. ■ 

No es necesario que una matriz de n x n tenga n valores propios distintos para ser dia¬ 
gonalizable. La matriz de 3 x 3 del ejemplo 3 es diagonalizable aun cuando tenga solamente 
dos valores propios diferentes. 


EJEMPLO 5 Determine si la siguiente matriz es diagonalizable. 


A = 


5 

0 

0 


-8 

0 

0 


1 

7 

-2 


SOLUCIÓN ¡Esto es fácil! Como la matriz es triangular, sus valores propios son evidente¬ 
mente 5, 0 y —2. Al ser A una matriz de 3 x 3 con tres valores propios distintos, entonces A 
es diagonalizable. ■ 


Matrices cuyos valores propios no son diferentes 

Si una matriz A de n x n tiene n valores propios distintos, con los vectores propios correspon¬ 
dientes Vi,..., v„, y si P = [vi ••• v„], entonces P es automáticamente invertible porque sus 
columnas son linealmente independientes, según el teorema 2. Cuando A es diagonalizable, 
pero tiene menos de n valores propios diferentes, sigue siendo posible construir P en una for¬ 
ma que la hace automáticamente invertible, como lo demuestra el siguiente teorema. 1 


Sea A una matriz de n x n cuyos distintos valores propios son Ai,..., A ;) . 

a) Para 1 < k < p, la dimensión del espacio propio para Ai- es menor o igual que la 
multiplicidad del valor propio A*-. 

b) La matriz A es diagonalizable si y solo si la suma de las dimensiones de los espacios 
propios es igual a n, y esto ocurre si y solo si: i. se factoriza completamente el poli¬ 
nomio característico en factores lineales y ii. la dimensión del espacio propio para 
cada A* es igual a la multiplicidad de A/,. 

c) Si A es diagonalizable y £>r- es una base para el espacio propio asociado con Am¬ 
para cada k, entonces la colección de vectores total en los conjuntos B p for¬ 

ma una base de vectores propios para R". 


EJEMPLO 6 Diagonalice la siguiente matriz, si es posible. 

" 5 0 0 0" 

0 5 0 0 

A ~ 14-30 

-1 -2 0 -3 


1 La demostración del teorema 7 es larga, pero no difícil. Por ejemplo, véase S. Friedberg, A. Insel, y L. Spence, 
Linear Algebra, 4a. ed. (Englewood Cliffs, NJ: Prentice-Hall, 2002), sección 5.2. 
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SOLUCIÓN Puesto que A es una matriz triangular, los valores propios son 5 y —3, cada uno 
con multiplicidad 2. Utilizando el método de la sección 5.1, se encuentra una base para cada 
espacio propio. 


Base para A = 5: 



"-8 


"-16" 


4 


4 

Vi = 

1 

II 

<N 

> 

0 


0 


1 



"0 


" 0 " 

Base para A = — 3: V 3 = 

0 


0 

1 

II 

0 


0 


1 


El conjunto {Vi,_, V 4 } es linealmente independiente, según el teorema 7. Así, la matriz 

P = [v, • • • V4] es invertible, en tanto que A = PDF \ donde 


"-8 

-16 

0 

0 ~ 


"5 

0 

0 

0 " 

4 

4 

0 

0 

y D = 

0 

5 

0 

0 

1 

0 

1 

0 

0 

0 

-3 

0 

0 

1 

0 

1 


0 

0 

0 

-3 


PROBLEMAS DE PRÁCTICA 


1 . 

2 . 


Calcule A 8 , donde A 


4 -3 
2 -1 


Sean A 


'-3 

12 ' 


' 3 ' 


'2' 

-2 

7 

, Vi = 

1 

y v 2 = 

1 


. Suponga que le han dicho que v¡ y V 2 


son vectores propios de A. Utilice esta información para diagonalizar A. 


3. Sea A una matriz de 4 x 4 con valores propios 5, 3 y —2, y suponga que se sabe que 
el espacio propio para A = 3 es bidimensional. ¿Se dispone de suficiente información 
para determinar si A es diagonalizable? 


5.3 EJERCICIOS 


En los ejercicios 1 y 2, sea A = PDP 1 y calcule A 4 . T 2 —1 — 1 

5. A = 1 4 1 



L - J 

II 1 

L * J 

II 

'1-1 0' 

'3 0 0' 

0 -1 -1' 





= 

-1 1 -1 

0 2 0 

-1 -1 -1 

2. P = 

' 1 2' 

2 3 

, D = 

' 1 0' 

0 3 


0 -1 1 

0 0 3 

-1 -1 0 


En los ejercicios 3 y 4. use la factorización A = PDP 1 para calcular 
A k , donde k representa un entero positivo arbitrario. 


6. A = 


3 

-3 

0 


0 

4 

0 


0 

9 

3 


a 

0' 


' 1 

0 " 

a 

0' 

1 

0 " 

2 (a — b) 

b 


2 

1 

0 

b _ 

-2 

1 


3 

0 

-1 

3 

0 

0 

0 

0 

1 

0 

1 

-3 

0 

4 

0 

-3 

1 

9 

1 

0 

0 

0 

0 

3 

-1 

0 

3 


r 1 -«i 


'3 

-2" 

'-3 

0" 

"-1 

2" 

LO 

1 


2 

-1 

0 

-2 

-2 

3 _ 


En los ejercicios 5 y 6, la matriz A se factoriza en la forma PDP 1 . 
Utilice el teorema de diagonalización para encontrar los valores pro¬ 
pios de A y una base para cada espacio propio. 


En los ejercicios 7 a 20, diagonalice las matrices, si es posible. Para 
los ejercicios 11 a 16 y 18, se incluyen los valores propios reales 
debajo de la matriz. 


7. 


1 

6 


0 

-1 


8 . 


3 

0 


2 

3 
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En los ejercicios 21 y 22, A, B.Py D son matrices de n x n. Indique 
si cada enunciado es verdadero o falso. Justifique cada respuesta. 
(Antes de intentar resolver estos ejercicios, estudie con cuidado los 
teoremas 5 y 6, y los ejemplos de esta sección). 

21. a) A es diagonalizable si A = PDP 1 para alguna matriz D y 

alguna matriz P invertible. 

b ) Si IR" tiene una base de vectores propios de A, entonces A es 
diagonalizable. 

c) A es diagonalizable si y solo si A tiene n valores propios, 
contando multiplicidades. 

d) Si A es diagonalizable, entonces A es invertible. 

22. a) A es diagonalizable si A tiene n vectores propios. 

tí) Si A es diagonalizable, entonces A tiene n valores propios 
distintos. 

c) Si AP = PD, con D diagonal, entonces las columnas distin¬ 
tas de cero de P deben ser vectores propios de A. 

d) Si A es invertible, entonces A es diagonalizable. 

23. A es una matriz de 5 x 5 con dos valores propios. Un espacio 
propio es tridimensional y el otro espacio propio es bidimensio- 
nal. ¿A es diagonalizable? ¿Por qué? 

24. A es una matriz de 3 x 3 con dos valores propios. Cada espacio 
propio es unidimensional. ¿A es diagonalizable? ¿Por qué? 


25 . A es una matriz de 4 x 4 con tres valores propios. Un espacio 
propio es unidimensional, y uno de los otros espacios propios 
es bidimensional. ¿Es posible que A no sea diagonalizable? 
Justifique su respuesta. 

26 . A es una matriz de 7 x 7 con tres valores propios. Un espacio 
propio es bidimensional, y uno de los otros espacios propios 
es tridimensional. ¿Es posible que A no sea diagonalizable? 
Justifique su respuesta. 

27 . Demuestre que si A es diagonalizable e invertible, entonces tam¬ 
bién lo es A -1 . 

28. Demuestre que si A tiene n vectores propios linealmente in¬ 
dependientes, entonces ocurre lo mismo con A T . [Sugerencia: 
Use el teorema de diagonalización], 

29 . Una factorización A = PDP 1 no es única. Demuestre esto 

f 3 Ol 

para la matriz A del ejemplo 2. Con D¡ = ^ , utilice 

la información del ejemplo 2 para encontrar una matriz P\ tal 
que A = PiDiPi~ l . 

30 . Con Ay D como en el ejemplo 2, encuentre una Pj invertible, 
distinta de la P del ejemplo 2, tal que A = PiDP^ 1 - 

31 . Construya una matriz de 2 x 2 distinta de cero que sea inverti¬ 
ble, pero no diagonalizable. 

32 . Construya una matriz de 2 x 2 no diagonal que sea diagonaliza¬ 
ble, pero no invertible. 

[M] En los ejercicios 33 a 36, diagonalice las matrices. Utilice la 
instrucción de valores propios de su programa matricial para obtener 
los valores propios y. luego, calcule bases para los espacios propios 
como en la sección 5.1. 


9 

-4 

-2 

-4 

56 

32 

-28 

44 

14 

— 14 

6 

-14 

42 

-33 

21 

-45 


-9 

-7 

8 

2 

-9 

0 

7 

14 

10 

5 

-5 

-10 

3 

7 

0 

4 

-13 

-7 

10 

11 


13 

-12 

9 

-15 

9 

6 

-5 

9 

-15 

9 

6 

-12 

-5 

6 

9 

6 

-12 

9 

-8 

9 

-6 

12 

12 

-6 

-2 

24 

-6 

2 

6 

2 

72 

51 

9 

-99 

9 

0 

-63 

15 

63 

63 

72 

15 

9 

-63 

9 

0 

63 

21 

-63 

-27 
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SOLUCIONES A LOS PROBLEMAS DE PRACTICA 

1. det (A — XI) = A 2 — 3A + 2 = (A — 2)(A — 1). Los valores propios son 2 y 1, y los 


vectores propios correspondientes son Vi = 


D 


y y i = 


y p 


. Ahora, forme 


Como A = PDP ', 

A 8 = PD S P 


3 

r 

" 2 8 

0 ' 

1 

-1 

2 

1 

0 

i 8 _ 

-2 

3 

3 

r 

'256 

0 ' 

1 

-1 

2 

1 

0 

1 

-2 

3 


766 -765 
510 -509 


2. Calcule Avi 


r-3 121 

"3' 


'3' 

1 - 

1 

K> 

1_ 

1 


1 


1 - vi, y 


Av 2 = 


'-3 

12 ' 

'2' 


'6' 

-2 

7 

1 


3 


= 3- v 2 


De manera que vi y v 2 son vectores propios para los valores propios 1 y 3, respectiva¬ 
mente. Entonces, 

A = PDP~ l donde, P = 

3. Sí, A es diagonalizable. Existe una base {Vi, v 2 } para el espacio propio asociado a 
A = 3. Asimismo, habrá al menos un vector propio para A = 5 y uno para A = — 2, deno¬ 
tados mediante V3 y V4. Entonces, {v 2 , v 2 , V3, V4} es linealmente independiente de acuer¬ 
do con el teorema 2 y el problema de práctica 3 de la sección 5.1. No pueden existir más 
vectores propios que sean linealmente independientes de vj, v 2 , V3, V4, porque los vectores 
están en R 4 . Por consiguiente, los espacios propios para A = 5yA = —2 son ambos uni¬ 
dimensionales. De acuerdo con el teorema Ib) se tiene que A es diagonalizable. 


D 


1 0 
0 3 


5.4J VECTORES PROPIOS Y TRANSFORMACIONES LINEALES 

El objetivo de esta sección es entender la factorización matricial A = PDP 1 como un 
enunciado sobre transformaciones lineales. Se verá que la transformación x Ax es esen¬ 
cialmente lo mismo que el muy simple mapeo u •-> Du, cuando se estudia desde un enfo¬ 
que adecuado. Una interpretación similar se aplicará a D y A, aun cuando D no sea una 
matriz diagonal. 

De la sección 1.9, recuerde que cualquier transformación lineal T de R" a R m se im- 
plementa mediante la multiplicación por la izquierda por una matriz A, llamada matriz están¬ 
dar de T. Ahora se necesita el mismo tipo de representación para cualquier transformación 
lineal entre dos espacios vectoriales de dimensión finita. 
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La matriz de una transformación lineal 

Sean V un espacio vectorial «-dimensional, W un espacio vectorial «¡-dimensional y T cual¬ 
quier transformación lineal de V a W. Para asociar una matriz con T, se eligen bases (ordena¬ 
das) B y C para Vy W, respectivamente. 

Dada cualquier x en V, el vector de coordenadas [x] g está en IR" y el vector de coordena¬ 
das de su imagen, [r(x)] c , está en R m , como se indica en la figura 1. 


V j w 



FIGURA 1 Una transformación lineal de V a IV. 


Es fácil encontrar la conexión entre [x] fí y [7Yx)] ( ,. Sea {bi,_, b„¡ la base B para V. 

Si x = ¡'ibi + ••• + r„b„, entonces, 


n 


[x]s = 


r„ 


y 

T{x) = T(r x b, + ••• + r„b„) = rir(bi) +-f r n T( b„) (1) 

porque T es lineal. Ahora, como el mapeo coordenado de W a R m es lineal (teorema 8 de la 
sección 4.4), la ecuación (1) conduce a 

[ T(x) ] c = n [ r(bO ] c + ■■■ + >-„[ T( b„) ] c (2) 

Puesto que los vectores de coordenadas C están en R'", así la ecuación vectorial (2) se escribe 
como una ecuación matricial; a saber, 


[7Xx)L = M[x\, 


( 3 ) 


-+m 




donde 



r 

Multiplicación 

' 

M=[[T( bj)] c [7’(b 2 )] c ■ 

• [T( b„)] c ] 


[X] 


e por M 

FIGURA 2 


-► mx)i c 


(4) 


La matriz M es una representación matricial de T, llamada matriz para T respecto a las 
bases B y C. Véase la figura 2. 

La ecuación (3) indica que, en lo concerniente a los vectores de coordenadas, la acción 
de T sobre x se puede considerar una multiplicación por la izquierda por M. 


EJEMPLO 1 Suponga que B = {bi,b 2 } es una base para Vy C = {ci, C 2 , C 3 } es una base 
para W. Sea T: V—» W una transformación lineal con la propiedad 

L(bi) = 3ci - 2c 2 + 5c 3 y L(b 2 ) = 4ci + 7c 2 - c 3 

Determine la matriz M para T respecto a B V C. 
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SOLUCIÓN Los vectores de coordenadas C de las imágenes de b| y Ib son 


Por lo tanto. 


n bt)] c = 

3 

-2 

y 

[TQ b 2 )] c = 

4 

7 

5 



-1 





, 


M = 


3 4 

-2 7 

5 -1 


Si B y C son bases para el mismo espacio V y si 7’ es la transformación identidad 
7(x) = x para x en V, entonces la matriz M en la ecuación (4) es justo una matriz de cam¬ 
bio de coordenadas (véase la sección 4.7). 


Transformaciones lineales de Fen V 

En el caso común donde W es igual a V y la base C coincide con B, la matriz M en (4) se 
denomina matriz para 7 respecto a B. o simplemente B-matriz para 7, y se denota con 
[T] b . Véase la figura 3. 

La B-matriz para 7: V—» V satisface 

[T(x)] b = [T] b [x] b para toda x en V (5) 

FIGURA 3 

EJEMPLO 2 El mapeo 7 : P 2 — » Pb definido por 

T(a o + a\t + ajt 2 ) = a i + 2ci2t 

es una transformación lineal. (Los estudiantes de cálculo reconocerán T como el operador 
derivada). 

a) Determine la B-matriz para T, cuando B es la base {1 , t, t 2 }. 

b) Compruebe que [ r(p) ] = [ T ] g [ p ] B para toda p en P 2 - 

SOLUCIÓN 

a) Determine las imágenes de los vectores básicos: 

7(1) = 0 El polinomio cero 

7(f) =1 El polinomio cuyo valor siempre es 1 

7(í 2 ) = 2 1 

Después, escriba los vectores de B-coordenadas de 7(1), 7(0 y 7(r 2 ) (que en este ejemplo 
se localizan por inspección) y júntelos en la B-matriz para 7: 



por [dg 


* 


[r(i)] B 


"0 


T 


"0" 

0 

, inm B = 

0 

. [T(ñ] B = 

2 

0 

0 

0 


o 

2 

0 


1 

0 

o 
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WEB 


TEOREMA 8 


b ) Para un general p(t) = üq + ci\t + a 2 t 2 


[T(p)] g = [a 1 + 2a 2 t] B 


a i 
2 a 2 

0 


"0 

1 

0 " 

a 0 

0 

0 

2 

a\ 

0 

0 

0 

_a 2 _ 


Véase la figura 4. 


T 



FIGURA 4 Representación matricial de una 
transformación lineal. 


Transformaciones lineales sobre U n 

En un problema aplicado que implica a IR", en general una transformación lineal T aparece 
primero como una transformación matricial, x , 4 x. Si A es diagonalizable, entonces hay 
una base B para R" que consiste en vectores propios de A. A continuación, el teorema 8 de¬ 
muestra que, en este caso, la B -matriz para T es diagonal. Diagonalizar A equivale a encontrar 
una representación matricial diagonal x i-> Ax. 


Representación matricial diagonal 

Suponga que A = PDP _1 , donde D es una matriz de n x n diagonal. Si B es la base 
para R" formada con las columnas de P, entonces D es la £>-matriz para la transfor¬ 
mación x i-» Ax. 


DEMOSTRACIÓN Denote las columnas de P con bi,..., b„, de manera que B = {bi,..., b„} 
y P = [b] ••• b„]. En este caso, P es la matriz de cambio de coordenadas P¡¡ analizada en 
la sección 4.4, donde 


P[x] B = x y [x] B = P ! x 
Si T(x) = Ax para x en R", entonces, 


[T] b = [[T( bi)] B ••• [T( b„)] B ] 

= [[^bi] B ••• [ Ab„ } B ] 

= [/>- 1 Ab 1 ••• P~ l Ab n ] 

= P~ 1 A[ b, ••• b„] 

= P~ X AP 


Definición de [7"]^ 
Porque T(x) = Ax 
Cambio de coordenadas 
Multiplicación matricial 


Puesto que A = PDP ', entonces se tiene [T ] B = P l AP = D. 


(6) 
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7 2 

-4 1 


EJEMPLO 3 Defina 7^: [R 2 —> [R 2 por T(x) = Ax, donde A 
una base B para IR 2 con la propiedad de que la £>-matriz para T es una matriz diagonal. 
SOLUCIÓN Del ejemplo 2 de la sección 5.3, se conoce que A = PDP x , donde 


. Encuentre 


P = 


1 1 

-1 -2 


y 



o 

3 


Las columnas de P, denotadas mediante bi y b 2 , son vectores propios de A. Según el teo¬ 
rema 8, D es la £>-matriz para T cuando B = {bi, b2 } - Los mapeos x i-> Ax yu^ Du des¬ 
criben la misma transformación lineal respecto a diferentes bases. ■ 


Similitud de representaciones matriciales 

La demostración del teorema 8 no utilizó la información de que D era diagonal. Por lo tanto, 
si A es similar a una matriz C, con A = PCP _1 , entonces C es la £>-matriz para la trans¬ 
formación x i-» Ax cuando la base B está formada por las columnas de P. La figura 5 ilustra 
la factorización A = PCP x . 


Multiplicación 
por P -1 


Mk 


Multiplicación 


por A 


Multiplicación 


por C 


->Ax 


Multiplicación 
por P 


-> [Ax] b 


FIGURA 5 Similitud de dos representaciones matriciales: 
A = PCP 1 . 


Inversamente, si T : R" —» R" está definida por T(x) = Ax, y si B es cualquier base 
para R", entonces la £>-matriz para T es similar a A. En efecto, los cálculos en la demostra¬ 
ción del teorema 8 indican que si P es la matriz cuyas columnas provienen de los vectores 
en B, entonces, [T]¡¡ = P~ X AP. Así, el conjunto de todas las matrices similares a una matriz 
A coincide con el conjunto de todas las representaciones matriciales de la transformación 
x h-» Ax. 


EJEMPLO 4 


Sean A = 


4 

4 




y b 2 


. El polinomio caracterís¬ 


tico de A es (A + 2) 2 , sin embargo, el espacio propio para el valor propio —2 es unidimen¬ 
sional; de manera que A no es diagonalizable. Sin embargo, la base B = {b i, b 2 } tiene la 
propiedad de que la £>-matriz para la transformación x hh> Ax es una matriz triangular llamada 
forma de Jordán de A. 1 Determine esta £>-matriz. 


SOLUCIÓN Si P = [bi b 2 ], entonces la £>-matriz es P X AP. Calcule 


AP = 


P~ l AP = 



2 ' 


'-6 

-1" 

1 


-4 

0 


-6 

- 1 " 


'-2 

r 

4 

0 


0 

-2 


1 Cada matriz cuadrada A es similar a una matriz en forma de Jordán. La base utilizada para generar una forma 
de Jordán consiste en vectores propios y los llamados “vectores propios generalizados” de A. Véase el capítulo 9 de 
Applied Linear Algebra, 3a. ed. (Englewood Cliffs, NJ: Prentice-Hall, 1988), de B. Noble y J. W. Daniel. 
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- NOTA NUMÉRICA - 

Una forma eficiente de calcular una U-matriz de P~ l AP es determinando AP y, luego, 
reduciendo por filas la matriz aumentada [P AP] a [/ P l AP], Es innecesario un 
cálculo por separado de P 1 . Véase el ejercicio 15 de la sección 2.2. 


PROBLEMAS DE PRÁCTICA 

1. Determine T(ao + a\t + cH 2 ), si T es la transformación lineal de P 2 a PS cuya matriz 
respecto a B = { 1 , t, t 2 ] es 


3 4 0 

0 5-1 

1 -2 7 


2. Sean A, B y C matrices de n x n. En el texto se ha demostrado que si A es similar a B, 
entonces B es similar a A. Esta propiedad, junto con los enunciados que se muestran de¬ 
bajo, indica que “similar a” es una relación de equivalencia. (La equivalencia por fila 
es otro ejemplo de una relación de equivalencia). Compruebe los incisos a) y b). 

a) A es similar a A. 

b) Si A es similar a B. y B es similar a C, entonces A es similar a C. 


5.4 EJERCICIOS 


1. Sean B — {bi, b 2 , l» 3 } y T> = ¡di, d 2 } las bases de los espacios 
vectoriales V y W. respectivamente. Sea T : V —» W una trans¬ 
formación lineal con la propiedad 

r(bi) = 3d! - 5d 2 , T(b 2 ) =-di + 6d 2 , T(b 3 ) = 4d 2 

Determine la matriz para T respecto a B y D. 

2. Sean T> = {dr, d 2 ) y 6 = [b u b 2 ) las bases para los espacios 
vectoriales V y W, respectivamente. Sea T : V —> W una trans¬ 
formación lineal con la propiedad 

r(di) = 3b, - 3b 2 , T( d 2 ) = -2b¡ + 5b 2 

Determine la matriz para T respecto a T> y B. 

3. Sean £ = {ei, e 2 , e 3 } la base estándar para IR 3 , B = {bi, b 2 , b 3 } 
una base para un espacio vectorial V, y T : IR 3 —» V una trans¬ 
formación lineal con la propiedad 

T(xi,x 2 ,x 3 ) = (2.v 3 -x 2 )bi - (2x 2 )b 2 + (xi + 3x 3 )b 3 


a) Calcule r(ef), r(e 2 ) y r(e 3 ). 

b) Obtenga [r(ei)] B , [T(e 2 )] e y [r(e 3 )] B . 

c ) Determine la matriz para T respecto a £ y B. 


4. Sean B = { b 3 , b 2 , b 3 ¡ una base para un espacio vectorial V y 
T : V —> IR 2 una transformación lineal con la propiedad 


T(x 1 b 3 + x 2 b 2 + x 3 b 3 ) — 


2xi — 3 x 2 + x 3 
—2xi + 5x 3 


Encuentre la matriz para T respecto a B y la base estándar 
para IR 2 . 


5. Sea T: P 2 —» P 3 la transformación que mapea un polinomio p(f) 
en el polinomio (t + 3)p(í). 

a) Encuentre la imagen de p(f) = 3 — 2 1 + t 2 . 

b) Demuestre que T es una transformación lineal. 

c) Obtenga la matriz para T respecto a las bases {1, t, t 2 } y 
{1, t, t 2 , f 3 }. 

6 . Sea T : P 2 —» P 4 la transformación que mapea un polinomio p(f) 
en el polinomio p(f) + 2 f 2 p(f). 

a) Determine la imagen de p(f) = 3 — 2 1 + t 2 . 

b) Demuestre que T es una transformación lineal. 

c ) Encuentre la matriz para T respecto a las bases {1, t, t 2 } y 
{1, t, t 2 , f 3 , f 4 ). 

7. Suponga que el mapeo T: P 2 —> P 2 definido por 

T (¿Jq + ci\t -f ¿J 2 t“) — 3fl 0 "b (5a 0 — 2ü\)t -b (4 ci^ -b ¿j 2 )í“ 

es lineal. Obtenga la representación matricial de T respecto a 
la base B = { 1 , t, t 2 j. 

8 . Sea B = {bi, b 2 , b 3 ) una base para un espacio vectorial V. 
Encuentre J(4bi — 3 b 2 ) cuando T es una transformación lineal 
de V a V cuya matriz respecto a B es 


[T] 


B 


0 0 1 

2 1 -2 

1 3 1 
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'p(-l)' 

9. Defina T : Pi —> R 3 por T( p) = p(0) 

. P(0 . 

a) Encuentre la imagen bajo T de p(t) = 5 + 3f. 

b) Pruebe que T es una transformación lineal. 

c) Obtenga la matriz para T respecto a la base {1, t, t 2 } para 
Pi y la base estándar para IR 3 . 

"P(— 2) 

10. Defina T : P 3 -> R 4 por F(p) = P< ^ 

Pd) 

. P(0) 

a) Demuestre que T es una transformación lineal. 

b) Encuentre la matriz para T respecto a la base ¡1. t, t 2 , í 3 } 
para P 3 y la base estándar para IR 4 . 

En los ejercicios 11 y 12, determine la 13-matriz para la transforma¬ 
ción x i-»Ax donde B = {bi, bij. 

, r- 4 -11 u r- 1 ! 1 , r- 1 ! 

" ■*=[ 6 1 J- b ' = L 2j- b = = L ij 

12 - '*=[”$ "o]’ b '= [?]■*■•= [ _ 2 _ 

En los ejercicios 13 a 16, defina T : R 2 1 -» R 2 por T(x) = Ax. Deter¬ 
mina una base B para R 2 con la propiedad de que [T] B es diagonal. 

13 • A= * 14 . A= ^ 2 

" 1 2 1 r 4 —2" 

15 - L 3 -4J 16 -^=[-l 5 . 

4 11 

17. Sean A = 2 y B = {bi, b?} para bi = 

b 2 = 2 ■ Dtfma T : R 2 —> R 2 tal que T(x) = Ax. 

a) Compruebe que bi es un vector propio de A, pero que A no 
es diagonalizable. 

b) Encuentre la £>-matriz para T. 

18. Defina T : R 3 —> R 3 mediante T(x) = Ax, donde A es una matriz 
de 3 x 3 con valores propios de 5, 5 y —2. ¿Existe una base 
B para R 3 tal que la 13-matriz para T sea una matriz diagonal? 
Analice. 



En los ejercicios 19 a 24, compruebe los enunciados. Las matrices 
son cuadradas. 


22. Si A es diagonalizable y 6 es similar a A, entonces B también es 
diagonalizable. 

23. Si B = P l AP y x es un vector propio de A correspondiente a 
un valor propio A, entonces P _1 x es un vector propio de B tam¬ 
bién asociado con A. 

24. Si A y B son similares, entonces tienen el mismo rango (dimen¬ 
sión del espacio imagen). [Sugerencia: Consulte los ejercicios 
complementarios 13 y 14 del capítulo 4], 

25. La traza de una matriz cuadrada A es la suma de las entradas 
diagonales en A y se denota con tr A. Se puede comprobar que 
tr(FG) = tr(GF) para cualesquiera dos matrices Fy G den x n. 
Demuestre que si A y 5 son similares, entonces tr A = tr B. 

26. Se puede demostrar que la traza de una matriz A es igual a la 
suma de los valores propios de A. Compruebe este enunciado 
para el caso cuando A es diagonalizable. 

27. Sean V = R n con una base B = {bi,..., b„j, y W = R" con la 
base estándar que se denota mediante £\ y considere la trans¬ 
formación identidad / : R" —> R", donde 7(x) = x. Obtenga la 
matriz para I respecto a B y £. ¿Cómo se llamó a esta matriz 
en la sección 4.4? 

28. Sean V un espacio vectorial con una base B = {bi,..., b,,j y 
W el mismo espacio V con una base C = ¡Ci,..., c„}; I es la 
transformación identidad / : V —> W. Encuentre la matriz 
para I respecto a B y C. ¿Cómo se llamó a esta matriz en la 
sección 4.7? 

29. Sea Eun espacio vectorial con una base B = [bj,..., b„}. Deter¬ 
mine la 73-matriz para la transformación identidad I : V — > V. 

[M] En los ejercicios 30 y 31, determine la 73-matriz para la trans¬ 
formación x Ax donde B = {bi, b 2 . bj j. 



19. Si A es invertible y similar a B, entonces B es invertible y A~* 
es similar a B~ l . [Sugerencia: P~ 1 AP = B para alguna P inver¬ 
tible. Explique por qué B es invertible. Luego, determine una Q 
invertible tal que QT X A^ X Q = 7G 1 ]. 

20. Si A es similar a B, entonces A 2 es similar a B 2 . 

21. Si B es similar a A y C es similar a A, entonces B es similar 
aC. 


32. [M] Sea T la transformación cuya matriz estándar se presenta a 
continuación. Determine una base para R 4 con la propiedad de 
que [F]g sea diagonal. 
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SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Sea p(f) = «o + a \t + oit 2 , y calcule 


[np)] B = [ t ] b [ p] b 


"3 

4 

0" 

C'O 


3ao + 4a i 

0 

5 

-1 

cu 

= 

5a i — «2 

1 

-2 

7 

_ a 2 _ 


«o — 2«i + lai 


Así, T(p) = (3ao + 4ai) + (5ai — « 2 )t + (ao — 2a\ + lao)t 2 . 

2. a) A = (7) _1 A/, entonces A es similar a A. 

b) Por hipótesis, existen matrices invertibles P y Q con la propiedad de que B = P 'AP 
y C = Q X BQ. Sustituya la fórmula para B en la expresión para C, y utilice un resul¬ 
tado acerca de la inversa de un producto: 

C = Q-'BQ = Q-\P~ l AP)Q = 0 PQ)-'A(PQ]) 

Esta ecuación tiene la forma adecuada para demostrar que A es similar a C. 


5.5 VALORES PROPIOS COMPLEJOS 

Puesto que la ecuación característica de una matriz de n x n implica un polinomio de grado 
n, la ecuación siempre tiene exactamente n raíces, contando las multiplicidades, siempre y 
cuando se admitan raíces complejas. Esta sección demuestra que si la ecuación característica 
de una matriz real A tiene algunas raíces complejas, entonces esas raíces aportan información 
importante acerca de A. La clave es dejar que A actúe sobre el espacio C” de n-adas de núme¬ 
ros complejos . 1 

Nuestro interés en C' ! no se origina por el deseo de “generalizar” los resultados de los 
capítulos anteriores, no obstante que ello abriría nuevas aplicaciones significativas en álgebra 
lineal . 2 Más bien, este estudio de valores propios complejos es esencial para revelar informa¬ 
ción “oculta” sobre ciertas matrices con entradas reales que se presentan en gran variedad de 
problemas de la vida cotidiana. Tales problemas incluyen muchos sistemas dinámicos reales 
que implican movimiento periódico, vibración o algún tipo de rotación en el espacio. 

La teoría del valor propio-vector propio matricial ya desarrollada para IR" se aplica bien 
a C". Así que un escalar complejo A satisface det(A — A7) = 0 si y solo si existe un vector 
distinto de cero x en C" tal que Ax = Ax. Decimos que A es un valor propio (complejo) y 
x su correspondiente vector propio (complejo). 


EJEMPLO 1 


Si A 



entonces la transformación lineal x i-> Ax on R 2 gira 


el plano en sentido antihorario, un ángulo de 90°. La acción de A es periódica, ya que, 
después de cuatro de tales aplicaciones, un vector regresa a su posición original. Eviden¬ 
temente, ningún vector distinto de cero se mapea sobre un múltiplo de sí mismo, de ma¬ 
nera que A no tiene vectores propios en IR 2 y, por lo tanto, carece de vectores propios reales. 
En efecto, la ecuación característica de A es 


A 2 + 1 = 0 


1 Consulte el apéndice B para un breve análisis de números complejos. El álgebra matricial y los conceptos 
sobre espacios vectoriales reales se podrían ampliar al caso de entradas y escalares complejos. En particular, 
A(cx + dy) = cAx + dAy, para A demxn, con entradas complejas, x, y en C", y c, d en C. 

2 Con frecuencia, en un segundo curso en álgebra lineal se analizan dichos temas, que son de mucha importancia 
en ingeniería eléctrica. 
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CAPITULO 5 


Valores propios y vectores propios 


Las únicas raíces son complejas: A = i y A 
sobre C 2 , entonces. 


-i. Sin embargo, si se permite que A actúe 


Así, i y —i son valores propios, con 






como sus vectores propios correspondien¬ 


tes. (En el ejemplo 2 se analiza un método para determinar vectores propios complejos). 
El principal interés de esta sección será la matriz del siguiente ejemplo. 


.5 -.6 

.75 1.1 


EJEMPLO 2 Sea A = 

una base para cada espacio propio. 

SOLUCION La ecuación característica de A es 


. Determine los valores propios de A, y encuentre 


0 = det 


.5-A 
.75 


-.6 
1.1 -A 


= (-5 — A)(l.l — A) — (—.6)(.75) 
= A 2 - 1.6A+ 1 


A = 0.8 ± .6 i, construya 
A —(.8- 


A = i[1.6± V(—L6) 2 - 

-4] = . 

8 ± .6 i. Para 

.6 /)/ = 

' .5 -.6 ' 


O 

SO 

1 

00 

.75 1.1 


L ° 

1 

SO 

1 

OO 


'-.3 + .6 i 


-.6 I 



.75 

.3 + .6/ 



propio 


( 1 ) 


La reducción por filas de la matriz aumentada usual es muy engorrosa a mano debido a su 
aritmética compleja. Sin embargo, a continuación se presenta una agradable observación que 
realmente simplifica el asunto: Puesto que .8 — .6 i es un valor propio, el sistema 


(—.3 + , 6 i)x\ — . 6 x 2 = 0 

( 2 ) 

,75.*i + (-3 + - 6 i)x 2 = 0 

tiene una solución no trivial (con X\ y X 2 posiblemente números complejos). Por lo tanto, am¬ 
bas ecuaciones en la ecuación ( 2 ) determinan la relación entre x¡ y xj, y cualquier ecuación 
sir\’e para expresar una variable en términos de la otra? 

La segunda ecuación en (2) conduce a 

.75xi = (—-3 — .6 /)x2 
Xi = (—.4 — .8í)x2 


Se elige X 2 = 5 para así eliminar los decimales, y se obtiene X| = —2 — 4 i. Una base para 
el espacio propio correspondiente a A = .8 — .6 i es 


V] 


-2 - 4 i 
5 


3 Otra forma de ver esto es considerando que la matriz en la ecuación (1) no es invertible, de manera que sus filas son 
linealmente dependientes (como vectores en C 2 ) y, por consiguiente, una fila es múltiplo (complejo) de la otra. 
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Cálculos semejantes para A = .8 + .6 i producen el vector propio 

.. r-2+4,1 


Como una comprobación, calcule 


'.5 

-.6' 

' -2 + 4 i ' 


' -4 + 2 i' 

.75 

1.1 

5 


4+3/ 


(.8 + . 6;> 2 ■ 


Sorprendentemente, la matriz A del ejemplo 2 determina una transformación x^Ax 
que en esencia es una rotación. Este hecho se hace evidente cuando se grafican los puntos 
adecuados. 


EJEMPLO 3 Una manera de ver cómo la multiplicación por la matriz A del ejemplo 2 
afecta los puntos consiste en graficar un punto inicial arbitrario, por ejemplo, xo = (2, 0), 
y después graficar imágenes sucesivas de este punto con multiplicaciones repetidas por A. 
Es decir, grafique 


xi = Ax 0 = 

x 2 = Ax i = 
x 3 = Ax 2 , .. 


'.5 

-.ó] 

.75 

Li J 

'.5 

-.ó] 

.75 

L! J 


2' 


O 

_1 

0 


l- 5 . 


1 .0' 


'-.4' 

1.5 


2.4 


La figura 1 muestra xo,. Xg como los puntos más grandes. Los puntos más pequeños son las 
ubicaciones de xg,..., xioo- La secuencia se encuentra sobre una órbita elíptica. ■ 



FIGURA 1 Iteración de un punto xo 
por la acción de una matriz con un 
valor propio complejo. 


Desde luego, la figura 1 no explica por qué ocurre la rotación. El secreto de la rotación 
está oculto en las partes real e imaginaria de un vector propio complejo. 

Partes real e imaginaria de vectores 

El complejo conjugado de un vector complejo x en C" es el vector x en C" cuyas entradas 
están los complejos conjugados de las entradas en x. Las partes real e imaginaria de un 
vector complejo x son los vectores Re x e Im x en R" formados con las partes real e imagi¬ 
naria de las entradas de x. 
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EJEMPLO 4 Six = 

"3 -i 
i 

_ 

"3 

0 

+ i 

"- 1 ' 
1 

; entonces 


2 + 5 i 


2 


5 



Rex = 

1 

m o 

i _ 

, Imx = 

~-l“ 

1 

y x = 

1 

m o 

i _ 

— i 

"-1 ' 
1 

_ 

1 

+ 7 

en 

i _ 


L 2j 


5 


L 2j 


5 


- 1 

fn 

1 

<N 
_1 


Si B es una matriz de m x n con posibles entradas complejas, entonces B denota la matriz 
cuyas entradas son los complejos conjugados de las entradas en B. Las propiedades de conju¬ 
gados de números complejos son válidas también en álgebra matricial compleja: 

rx = rx, Bx=Bx, ~BC =~BC y rB = r~B 

Valores propios y vectores propios de una matriz real 
que actúa sobre C n 

Sea A una matriz de n x n cuyas entradas son reales. Entonces, Ax = Ax = Ax. Si A es 
un valor propio de A y x su vector propio correspondiente en C", entonces. 


Ax = Ax = Ax = Ax 


Por lo tanto, Á también es un valor propio de A, con x su vector propio correspondiente. 
Esto demuestra que cuando A es real, sus valores propios complejos se presentan en pares 
conjugados. (Aquí y en todas partes, se utiliza el término valor propio complejo para refe¬ 
rirse a un valor propio A = a + bi, con b A 0). 


EJEMPLO 5 Los valores propios de la matriz real del ejemplo 2 son complejos conju¬ 
gados; a saber, .8 — . 6 i y .8 + . 6 i. Los vectores propios correspondientes que se encontraron 
en el ejemplo 2 también son conjugados: 



'-2-4 i' 


' -2 + 4 i ' 

Vi = 

5 

y v 2 = 

5 


El siguiente ejemplo proporciona el “bloque básico” para todas las matrices reales de 
2 x 2 con valores propios complejos. 


EJEMPLO 6 Si C 


a 

b 


—b 

a 


, donde a y b son reales, pero no ambos cero, entonces 


r / 

(a. b) 

b 




FIGURA 2 


los valores propios de C son A = a ± bi. (Véase el problema de práctica al final de esta sec¬ 
ción). También, si r = |A| = Va 2 + b 2 , entonces, 

cosí p —sencp 
sen<¿> eos <p 

donde <p es el ángulo entre el eje x positivo y el rayo que pasa por el origen y por (a, b). 
Véase la figura 2 y el apéndice B. El ángulo <p se llama el argumento de A = a + bi. Por con¬ 
siguiente, la transformación x Cx se puede ver como la composición de una rotación por 
un ángulo <p y un escalamiento por |A| (véase la figura 3). ■ 


1 

<3 


O 

1 

5*. 

Q 

V» 

o 


1 

O 
_1 


Finalmente, se está listo para descubrir la rotación que está oculta dentro de una matriz 
real que tiene un valor propio complejo. 
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Escalamiento x 

\ ,/ Rotación 

<P 


FIGURA 3 Una rotación seguida por 
un escalamiento. 


.5 -.6 

.75 1.1 


, A = .8 — . 6 i y vi = 


-2 - 4 i 
5 


como en el 


-2 -4 
5 0 


EJEMPLO 7 Sea A = 

ejemplo 2. También, sea P la matriz real de 2 x 2 

P = [Re vi Imvi ] = 

y sea 

C = P~ l AP = — 

20 

Por el ejemplo 6 , C es una rotación pura porque |A | 2 = (.8) 2 + (. 6) 2 = 1. De C = P l AP. 
se obtiene 


0 

4" 

'.5 

-. 6 ' 

'-2 

-4' 


'.8 

-. 6 ' 

-5 

-2 

.75 

1.1 

5 

0 


.6 

8 


PCP 


.8 -.6 

.6 8 


¡Aquí está la rotación “dentro” de A! La matriz P proporciona un cambio de variable, por 
ejemplo, x = Pu. La acción de A equivale a un cambio de variable de x a u, seguido de una 
rotación y, después, de regreso a la variable original. Véase la figura 4. La rotación pro¬ 
duce una elipse, como en la figura 1 , en vez de un círculo, ya que el sistema de coordenadas 
determinado por las columnas de P no es rectangular ni tiene longitudes unitarias idénticas 
sobre los dos ejes. ■ 


-► Ax 


Cambio de 
variable 


C 


Cambio de 
variable 


-► Cu 


Rotación 

FIGURA 4 Rotación debida a un valor propio complejo. 


El siguiente teorema demuestra que los cálculos del ejemplo 7 se adaptan a cualquier 
matriz real de 2 x 2 que tenga un valor propio complejo A. La demostración utiliza el he¬ 
cho de que si las entradas de A son reales, entonces A (Re x) = Re Ax y A(Im x) = Im Ax, y 
si x es un vector propio para un valor propio complejo, entonces Re x e Im x son linealmente 
independientes en IR 2 . (Véase los ejercicios 25 y 26). Se omiten los detalles. 


TEOREMA 9 


Sea A una matriz real de 2 x 2 con un valor propio complejo X = a — bi (b A 0) y un 
vector propio asociado v en C 2 . Entonces, 

A=PCP X donde P = [Re v Imv] y C= ? 
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FIGURA 5 

Iteraciones de dos puntos bajo 
la acción de una matriz de 3 x 3 
con un valor propio complejo. 


El fenómeno que se ilustra en el ejemplo 7 persiste en dimensiones más altas. Por ejem¬ 
plo, si A es una matriz de 3 x 3 con un valor propio complejo, entonces existe un plano en 
IR 3 sobre el cual A actúa como una rotación (posiblemente combinada con escalamiento). 
Cada vector en ese plano se gira en otro punto sobre el mismo plano. Se dice que el plano es 
invariante bajo A. 


EJEMPLO 8 


La matriz A = 


.8 -.6 

.6 .8 

0 0 


0 

0 

1.07 


tiene valores propios .8 ± . 6 i y 1.07. 


Cualquier vector wo en el plano X\X 2 (con la tercera coordenada cero) es girado por A en 
otro punto del plano. Cualquier vector xo que no esté en el plano tiene su coordenada Xj mul¬ 
tiplicada por 1.07. En la figura 5 se presentan las iteraciones de los puntos wo = (2, 0, 0) y 
xq = (2, 0, 1) con multiplicación por A. ■ 


PROBLEMA DE PRÁCTICA 

Demuestre que si a y b son reales, entonces los valores propios de A 
con los vectores propios correspondientes 



a —b 
b a 


son a 


bi, 


5.5 EJERCICIOS 


En los ejercicios 1 a 6, cada matriz actúa sobre C 2 . Determine los 
valores propios y una base para cada espacio propio en C 2 . 


1 . 


1 

1 


-2 

3 



-3 

3 


3. 


5 

-8 



-2 

3 


5. 


3 

-2 


1 

5 



-5 

3 


En los ejercicios 7 a 12, utilice el ejemplo 6 para listar los valores 
propios de A. En cada caso, la transformación x i-> Ax es la composi¬ 
ción de una rotación y de un escalamiento. Determine el ángulo i p de 
la rotación, donde -ir < ip £ ir, así como el factor de escala de r. 


7. 



-1 

x/3 




9. 


0 

-2 


2 

0 



.5 

0 


11 . 





En los ejercicios 13 a 20, encuentre una matriz P invertible y una 


matriz C de la forma 


a 

b 



tal que la matriz dada tenga la 


forma A = PCP '. 


1 

1 


-2 

3 



-3 

1 




-2 

6 




-5 

5 


19. 


1.52 -.7 
.56 .4 



-8 

5 


21. En el ejemplo 2, despeje %2 en la primera ecuación en (2) en 
términos de x\, para de ahí producir el vector propio 


2 

-1 + 2 i 


para la matriz A. Demuestre que este y es 


un múltiplo (complejo) del vector v¡ utilizado en el ejemplo 2. 


22. Sean A una matriz de n x n compleja (o real), y x en C" un 
vector propio correspondiente a un valor propio A en C. 
Demuestre que para cada escalar complejo /j distinto de cero, 
el vector ¿u,x es un vector propio de A. 


El capítulo 7 se enfocará en matrices con la propiedad A T = A. 
Los ejercicios 23 y 24 demuestran que cada valor propio de dichas 
matrices es necesariamente real. 


23. Sean A una matriz real de n x n tal que A T = A, x cualquier 
vector en C" y q = x T Ax. Las igualdades que se presentan a 
continuación demuestran que q es un número real comprobando 
que q = q. Dé una razón para cada paso. 


q = x T Ax = x T Ax = x T Ax = ( x T Ax) T = x T A T x = q 
a) b) c ) d) e) 


13 . 
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24. Sea A una matriz real de n x n con la propiedad A T = A. De¬ 
muestre que si Ax = Ax para algún vector x distinto de cero en 
C", entonces, en efecto, A es real y la parte real de x es un vector 
propio de A. [Sugerencia: Calcule x^x, y utilice el ejercicio 23. 
Asimismo, examine las partes real e imaginaria de Ax], 


[M] En los ejercicios 27 y 28. encuentre una factorización de la ma¬ 
triz A dada en la formaA = PCP _1 , donde C sea una matriz diagonal 
a bloques de 2 x 2 como se indica en el ejemplo 6. (Para cada par 
conjugado de valores propios, utilice las partes real e imaginaria de 
un vector propio en C 4 para crear dos columnas de P). 


25. Sean A una matriz real de n x n, y x un vector en C". Demues¬ 
tre que Re(Ax) = A(Rex) y Im(Ax) = A(Imx). 

26. Sea A una matriz real de 2 x 2 con un valor propio complejo 
A = a — bi (b =£ 0) y un vector propio asociado v en C 2 . 

a) Demuestre que A(Re v) = a Re v + b Im v y A(Im v) = 
— b Re v + a Im v. [Sugerencia: Escriba v = Re v + i Im v, 
y calcule Av], 

b) Compruebe que si P y C están dadas como en el teorema 9, 
entonces AP — PC. 


27. A = 


28. A = 


26 

33 

23 

20 

-6 

-8 

-1 

-13 

-14 

-19 

-16 

3 

-20 

-20 

-20 

-14 


7 

11 

20 

17 

-20 

-40 

-86 

-74 

0 

-5 

-10 

-10 

10 

28 

60 

53 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 

Recuerde que es fácil comprobar si un vector es un vector propio. No hay necesidad de exa¬ 
minar la ecuación característica. Calcule 


Ax = 


a —b 

r 


a + bi 


r 

b a 

—i 

— 

b — ai 

= (a + bi) 

—i 


Así 



es un vector propio correspondiente a A = a + bi. Del análisis en esta sección, 


resulta que 


debe ser un vector propio asociado con A = a — bi. 


5.6 SISTEMAS DINÁMICOS DISCRETOS 

Los valores propios y vectores propios ofrecen la clave para entender el comportamiento 
a largo plazo, o evolución , de un sistema dinámico descrito por una ecuación en diferen¬ 
cias x* + i = Ax¿- Dicha ecuación se utilizó en la sección 1.10 para modelar el movimiento 
de población; en la sección 4.9, varias cadenas de Markov; y en el ejemplo introducto¬ 
rio de este capítulo, la población de búhos manchados. Los vectores x* dan información 
acerca del sistema conforme transcurre el tiempo (que se denota con k). En el caso de los 
búhos manchados, por ejemplo, x¿- listó el número de búhos en tres clases de edades al 
tiempo k. 

En esta sección las aplicaciones se enfocan sobre problemas ecológicos, ya que son 
más fáciles de plantear y de explicar que, por ejemplo, problemas de física o de ingeniería. 
Sin embargo, los sistemas dinámicos se originan en muchos campos científicos. En cursos 
estándar de licenciatura de sistemas de control se estudian diversos aspectos de sistemas 
dinámicos. En tales cursos el método moderno de diseño del espacio de estados se basa sig¬ 
nificativamente en álgebra de matrices. 1 La respuesta de estado estable de un sistema de 
control es el equivalente en ingeniería de lo que aquí se denomina “comportamiento a largo 
plazo” del sistema dinámico x¿+i = Ax k . 


1 Véase G. F. Franklin, J. D. Powell y A. Emami-Naeimi, Feedback Control of Dynamic Systems , 5a. ed. (Upper 
Saddle River, NJ: Prentice-Hall, 2006). Este texto tiene una excelente introducción a modelos dinámicos (cap.2). 
Los capítulos 7 y 8 tratan el diseño del espacio de estados. 
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Hasta el ejemplo 6 , se supone que A es diagonalizable con n vectores propios lineal¬ 
mente independientes. Vi,..., v„, y sus valores propios correspondientes Ai,..., A„. Por 
conveniencia, se supone que los vectores propios están arreglados de tal manera que 
| Ai | > | A 2 I > ••• > |A„|. Puesto que {vi,...,v„} es una base para IR", entonces cualquier vec¬ 
tor inicial xo se puede escribir unívocamente en la forma 

Xo = CiVi -I-h c„v„ (1) 

Esta descomposición de vectores propios de xo determina lo que sucede a la secuencia {x¿-}. 
El siguiente cálculo generaliza el caso simple examinado en el ejemplo 5 de la sección 5.2. 
Como los v¡ son vectores propios 

Xi = zlxo = C\A\\ 4-b c„A\ n 

= C 1 A 1 V 1 + • • • + c„A„v„ 

En general, 

x* = CiCAO^V! +-hc„(A„) A 'v„ (k = 0,1,2,...) ( 2 ) 

Los siguientes ejemplos ilustran qué sucede en (2) conforme A—> °°. 


Un sistema depredador-presa 

En lo profundo de los bosques de secuoyas en California, las ratas de bosque de patas oscu¬ 
ras suministran el 80% de la dieta de los búhos manchados, el principal depredador de esos 
roedores nocturnos. El ejemplo 1 utiliza un sistema dinámico lineal para modelar el sistema 
físico de los búhos y las ratas. (Hay que admitir que aunque el modelo no es realista en varios 
aspectos, puede dar el punto de partida para el estudio de modelos no lineales más complica¬ 
dos utilizados por científicos ambientales). 


EJEMPLO 1 Denote las poblaciones de búhos y ratas de bosque al tiempo k por el 
O k 


vector x* 


Rk 


, donde k es el tiempo en meses, O k es el número de búhos en la región 


bajo estudio y R k es el número de ratas (medido en miles). Suponga que 


O k +i = (.5)0* + (A)R k 
Rk +1 = —p • O* + (1.1 )R k 



donde p es un parámetro positivo que se debe especificar. (.5)0* en la primera ecuación 
indica que si no hay ratas para alimentarse, entonces cada mes sobreviviría tan solo la mi¬ 
tad de los búhos; mientras que ( 1 . 1 )/?* en la segunda ecuación implica que sin los búhos como 
depredadores, la población de ratas crecería 10% cada mes. Si las ratas son abundantes, (.4) 
R k hará que crezca la población de búhos, en tanto que el término negativo —p ■ O k mide las 
muertes de ratas por la depredación de los búhos. (En efecto, 1000/? es el número promedio 
de ratas devoradas por un búho en un mes). Determine la evolución de este sistema, cuando el 
parámetro de depredación p es .104. 

SOLUCION Cuando p = .104, los valores propios de la matriz de coeficientes A para las 
ecuaciones (3) resultan ser Ai = 1.02 y A 2 = .58. Los vectores propios correspondientes son 



' 10 ' 


'5' 

vi = 

13 

, v 2 = 

1 


Un vector inicial xo se escribe como xo = CiVi + C 2 V 2 . Entonces, para k > 0, 

x* = c 1 (1.02) <c v 1 + c 2 (. 58)*v 2 


= ci(1.02)* 


10 

13 


+ c 2 (.58)* 
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Conforme k —» °°, entonces (.58) A rápidamente se aproxima a cero. Suponga que ci > 0. 
Por lo tanto, para toda k suficientemente grande, x¿ es aproximadamente igual a ci(1.02)*Vi, 
y se escribe 


xa- 


c 1 (1.02) i 


10 

13 


(4) 


La aproximación en (4) mejora conforme k se incrementa, y así para k grandes. 


Xjfc+l 


ci(1.02)* +1 


10 

13 


(1.02)ci(1.02)* 


10 

13 


1.02xa 


(5) 


La aproximación en la ecuación (5) indica que a final de cuentas ambas entradas de xa (los 
números de búhos y ratas) crecerán por un factor de casi 1.02 cada mes, un 2% de tasa de 
crecimiento mensual. Por (4), xa es aproximadamente un múltiplo de (10, 13), de manera que 
las entradas en xa están casi en la misma razón de 10 a 13. Es decir, por cada 10 búhos hay 
cerca de 13 mil ratas. ■ 


El ejemplo 1 muestra dos hechos generales acerca de un sistema dinámico xa+i = Ax a 
donde A es n x n, sus valores propios satisfacen |Ai| > 1 y 1 > |Ai| para j = 2,..., n y vi es 
un vector propio correspondiente a Ai. Si xo está dado por la ecuación (1), con A 0, enton¬ 
ces para todas las k suficientemente grandes, 

XA+1 « Aixa (6) 


y 

xa « ci(A0 fc vi (7) 

Las aproximaciones en (6) y (7) se pueden volver tan cercanas como se desee tomando una 
k muy grande. Por (6), finalmente crecerá casi por un factor de Ai cada vez, de manera 
que Ai determina la eventual tasa de crecimiento del sistema. Asimismo, por (7), la razón de 
cualesquiera dos entradas en xa (para k grande) es casi la misma que la razón de las entradas 
correspondientes en Vi. En el ejemplo 5 de la sección 5.2, se ilustra el caso donde A¡ = 1. 


Descripción gráfica de soluciones 

Cuando A es una matriz de 2 x 2, los cálculos algebraicos se complementan con una descrip¬ 
ción geométrica de la evolución del sistema. La ecuación Xa+i = Ax k se puede considerar una 
descripción de qué sucede al punto inicial Xo en R 2 , conforme se transforma repetidamente 
por el mapeo x i-> Ax. La gráfica de x 0 , x¡,... es la trayectoria del sistema dinámico. 


EJEMPLO 2 Grafique varias trayectorias del sistema dinámico xa+ i = Ax k , cuando 


80 0 
0 .64 


SOLUCIÓN Los valores propios de A son .8 y .64, con vectores propios Vi 


V2 


. Si xq = ciVi + C 2 V 2 , entonces. 


xa = Ci(.8) ¿ 


+ c 2 (.64)* 


0 

1 


Desde luego, x k tiende a 0 porque (. 8 ) A y (.64) A se aproximan a 0 conforme k —> °°. No obstan¬ 
te, resulta interesante la manera en que x k va hacia 0. La figura 1 (en la página 304) muestra 
los primeros términos escasos de varias trayectorias que empiezan en puntos sobre la frontera 
de la caja con vértices en (±3, ±3). Los puntos sobre cada trayectoria están conectados por 
una curva delgada, para que así la trayectoria sea más fácil de observar. ■ 
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FIGURA 1 El origen como un atractor. 


En el ejemplo 2, al origen se le denomina atractor del sistema dinámico porque todas 
las trayectorias tienden hacia 0. Esto ocurre siempre que ambos valores propios sean menores 
que 1 en magnitud. La dirección de la atracción más grande está a lo largo de la recta que pasa 
por 0 y el vector propio para el valor propio de menor magnitud. 

En el siguiente ejemplo, ambos valores propios de A son mayores que 1 en magnitud, y 0 
es un repulsor del sistema dinámico. Todas las soluciones de Xk i i = A x k excepto la solución 
cero (constante), no están acotadas y tienden a alejarse del origen. 2 


EJEMPLO 3 Grafique varias soluciones típicas de la ecuación x¿+i = Ax k , donde 


A = 


1.44 

0 


0 

1.2 


SOLUCIÓN Los valores propios de A son 1.44 y 1.2. Si xq = 


c i 
C2 


, entonces. 


x* = Cl (1.44)* 


+ C2(1.2) ¿ 


0 

1 


Ambos términos aumentaron en tamaño, pero el primer término lo hizo más rápido. Así, la 
dirección de la mayor repulsión es la recta que pasa por 0 y por el vector propio para el valor 
propio de magnitud más grande. La figura 2 muestra varias trayectorias que inician en puntos 
muy cercanos a 0. ■ 

En el siguiente ejemplo, 0 es un punto silla porque el origen atrae soluciones de algunas 
direcciones y las repele en otras direcciones. Esto ocurre siempre que un valor propio sea 
más grande que 1 en magnitud y el otro sea menor que 1 en magnitud. La dirección de ma¬ 
yor atracción está determinada por un vector propio del valor propio de menor magnitud. La 
dirección de la mayor repulsión se determina mediante un vector propio del valor propio de 
magnitud más grande. 


2 El origen es el único posible atractor o repulsor en un sistema dinámico lineal, aunque podrían existir múltiples 
atractores y repulsores en un sistema dinámico más general para el cual el mapeo X/. — > x*, ] no es lineal. En tal sis¬ 
tema, los atractores y los repulsores están definidos en términos de los valores propios de una matriz especial (con 
entradas variables) llamada matriz jacobiana del sistema. 
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EJEMPLO 4 


Grafique varias soluciones típicas de la ecuación y k+ 1 


Dyi¡, donde 


D = 


2.0 

0 


0 

0.5 


(Aquí se usaron D y y en vez de A y x porque este ejemplo se utilizará más adelante). Demues¬ 
tre que una solución {y¿-} no está acotada, cuando su punto inicial no está sobre el eje X 2 - 


SOLUCIÓN Los valores propios de D son 2 y 0.5. Si y 0 = 


c i 
C2 


, entonces, 


y k = ci2 ¿ 


+ C2(.5) k 


0 

1 


(8) 


Si yo está sobre el eje X 2 , entonces Ci = 0 y yr- —> 0 conforme k —» . Pero si yo no se encuen¬ 
tra sobre el eje X 2 , entonces el primer término en la suma para y/,- se vuelve arbitrariamente 
grande y, por lo tanto, {y¿} no está acotada. La figura 3 presenta diez trayectorias que inician 
cerca del eje X 2 o sobre este. ■ 



FIGURA 3 El origen como un punto silla. 
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Cambio de variable 

Los tres ejemplos anteriores implicaron matrices diagonales. Para tratar el caso no diagonal, 
regrese por un momento al caso n x n donde los vectores propios de A forman una base 
{vi,..., v,¡} para R". Sean P = [vi ••• v„], y D la matriz diagonal con los valores propios co¬ 
rrespondientes sobre la diagonal. Dada una secuencia {jc¿} que comprueba Xk i i = Ax k , defina 
una nueva secuencia {y/;} mediante 

y k = P~ l x k o, de manera equivalente, X/,. = Py k 

Sustituyendo esas relaciones en la ecuación x^+i = Ax k y utilizando que A = PDP ', se 
tiene que 

PVk+i = APy k = (PDP-')Py k = PDy k 
Se multiplican ambos lados por la izquierda por P 1 y se obtiene 

y k+l = Dy k 

Si se escribe y k como y (k) y se denotan las entradas en y (k) por y\(k ),..., y„{k), entonces, 


yúk + i)' 


"Ai 0 

0 " 


"y \(k)~ 

yi(k + i) 

= 

... O 

N> 

0 


yi(k) 

y„(k + 1)_ 


Lo ... 

o A„ _ 


_Vn(k) _ 


El cambio de variable de x k a y k ha desacoplado el sistema de ecuaciones en diferencias. 
La evolución de y\(k), por ejemplo, no se ve afectada por lo que suceda a y 2 (k),..., y n (k), 
porque y\(k + 1 ) = Ai • y\(k) para cada k. 

La ecuación x k = Py k indica que y k es el vector de coordenadas de x k con respecto a la 
base de vectores propios {vi,..., v„}. Se puede desacoplar el sistema x^+i = Ax k efectuando 
cálculos en el nuevo sistema de coordenadas de vectores propios. Cuando n = 2, esto equivale 
a emplear papel para graficar con ejes en las direcciones de los dos vectores propios. 


EJEMPLO 5 Demuestre que el origen es un punto silla para las soluciones de 
x*+t = Axk, donde 


1.25 -.75 

-.75 1.25 


Encuentre las direcciones de mayor atracción y de mayor repulsión. 


SOLUCION Utilizando técnicas estándar, se determina que los valores propios de A son 


y v 2 


, respectivamen- 


2 y .5, con los vectores propios correspondientes vi = 

te. Como \2\ > 1 y | .51 < 1, entonces el origen es un punto silla del sistema dinámico. Si 
x 0 = CiVi + c 2 v 2 , 

x k = c\2 k \i + c 2 (.5)^v 2 (9) 


Esta ecuación se ve exactamente igual que la ecuación ( 8 ) del ejemplo 4, con vi y v 2 en lugar 
de la base estándar. 

Sobre el papel para graficar, dibuje ejes a través de 0 y de los vectores propios y v 2 . 
Véase la figura 4. El movimiento a lo largo de los ejes corresponde al movimiento sobre los 
ejes estándar de la figura 3. En la figura 4, la dirección de mayor repulsión es la recta que 
pasa por 0 y el vector propio Vi cuyo valor propio es mayor que 1 en magnitud. Si xo está 
sobre esta recta, c 2 de la ecuación (9) es cero y x k se aleja rápidamente de 0. La dirección 
de mayor atracción está determinada por el vector propio v 2 cuyo valor propio es menor que 
1 en magnitud. 

En la figura 4 se ilustra un número de trayectorias. Cuando esta gráfica se observa en 
términos de los ejes de vectores propios, el esquema “parece” en esencia igual que el esquema 
de la figura 3. ■ 
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FIGURA 4 El origen como un punto silla. 


Valores propios complejos 

Cuando una matriz real A de 2 x 2 tiene valores propios complejos, entonces A no es dia- 
gonalizable (cuando actúa sobre IR 2 ), pero el sistema dinámico x¿+t = A\¡ ( es fácil de des¬ 
cribir. El ejemplo 3 de la sección 5.5 ilustró el caso donde los valores propios tienen valor 
absoluto 1. La iteración de un punto xo giró alrededor del origen con una trayectoria elíptica. 

Si A tiene dos valores propios complejos cuyo valor absoluto es mayor que 1, entonces 
0 es un repulsor y la iteración de xo girará en espiral hacia fuera en torno al origen. Si los 
valores absolutos de los valores propios complejos son menores que 1, entonces el origen es 
un atractor y la iteración de xo da una espiral hacia adentro acercándose al origen, como en 
el siguiente ejemplo. 


EJEMPLO 6 Se puede comprobar que la matriz 


A = 



.5 

1.0 


1 T 2 i 
1 


tiene valores propios .9 ± 2i, con vectores propios 

308) muestra tres trayectorias del sistema x¿. + 1 = Ax¿, con vectores iniciales 
0 

y -2.5 


. La figura 5 (en la página 


r oí 


ral 

i— 

K> 

Ln 

i_ 


1 

O 

i_ 


Supervivencia de los búhos manchados 

Recuerde del ejemplo introductorio de este capítulo que la población de búhos manchados en 
el área Willow Creek, California, se modeló con un sistema dinámico x ^+1 = A\¡- donde las 
entradas en x/ f = (/*, Sk, ak ) listaban los números de hembras (al tiempo k) en las etapas de vida 
juvenil, subadulto y adulto, respectivamente, y A es la matriz de etapas 


0 0 

.18 0 

0 .71 


.33 

0 

.94 


(10) 
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FIGURA 5 Rotación asociada con valores propios 
complejos. 


MATLAB muestra que los valores propios de A son aproximadamente Ai = .98, 
Á 2 = — .02 + .21/ y A 3 = —.02 — .21/. Observe que los tres valores propios son menores 
que 1 en magnitud, ya que |A 2 I 2 = |A 3 I 2 = (—,02 ) 2 + (.21 ) 2 = 0.445. 

Por el momento, deje que A actúe sobre el espacio vectorial complejo C 3 . Puesto que 
A tiene tres valores propios distintos, entonces los tres vectores propios correspondientes 
son linealmente independientes y forman una base para C 3 . Denote los vectores propios 
con Vi, V2 y V3. Así, la solución general de x^+i = Ax¡< ( (utilizando vectores en C 3 ) tiene la 
forma 


x k = ci(Ai/vi + c 2 (X 2 ) k \2 + c 3 (A 3 ) ír v 3 (11) 

Si xo es un vector inicial real, entonces x¡ = Axo es real porque A es real. Asimismo, la 
ecuación x^+i = Ax¿ indica que cada x¿ en el miembro izquierdo de la ecuación (11) es real, 
aun cuando se expresa como una suma de vectores complejos. Sin embargo, cada término 
en el miembro derecho de la ecuación ( 11 ) se aproxima al vector cero, ya que todos los va¬ 
lores propios son menores que 1 en magnitud. Por lo tanto, la secuencia real x/ f también tiende 
al vector cero. Tristemente, este modelo predice que, a final de cuentas, perecerán todos los 
búhos. 

¿Hay alguna esperanza para los búhos manchados? Recuerde del ejemplo introductorio 
que la entrada de 18% en la matriz A de la ecuación (10) es porque, no obstante que el 60% de 
los búhos juveniles sobreviven lo suficiente para dejar el nido y buscar nuevas áreas de distri¬ 
bución, tan solo el 30% de ese grupo sobrevive a dicha búsqueda y encuentra un nuevo hogar. 
La supervivencia a la mencionada búsqueda está significativamente influida por el número de 
áreas deforestadas en el bosque, lo cual vuelve más difícil y peligrosa esa búsqueda. 

Algunas poblaciones de búhos habitan en zonas con pocas o ninguna área deforesta¬ 
da. Quizás un porcentaje aún mayor de búhos juveniles sobrevivan ahí y encuentren nuevos 
territorios. De hecho, el problema del búho manchado es más complicado que como se ha 
expuesto, no obstante que el ejemplo final da un final feliz a la historia. 

EJEMPLO 7 Suponga que la tasa de supervivencia a la búsqueda, de los búhos juveniles, 
sea de 50%, de manera que la entrada (2, 1) de la matriz por etapas (de estados) A en (10) es 
.3 en vez de .18. ¿Qué predice el modelo de la matriz por etapas acerca de la población de 
búhos manchados? 

SOLUCIÓN Ahora los valores propios de A resultan ser aproximadamente Ai = 1.01, 
A 2 = —.03 + .26 i y A 3 = — .03 — .26/. Un vector propio para A¡ es aproximadamente 
Vi = (10, 3, 31). Sean v 2 y V 3 vectores propios (complejos) para A 2 y A 3 . En este caso, la 
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ecuación (11) se convierte en 


= ci(1.01)*Vi + c 2 (— .03 4- ,26i) k \ 2 + c 3 (—.03 — .26/) A 'v 3 

Cuando k —> °°, el segundo de los dos vectores tiende a cero. Así, x* se vuelve cada vez más 
semejante al vector (real) ci(1.01)*Vi. Las aproximaciones aplicadas en (6) y (7) provienen 
del ejemplo 1. Además, se puede demostrar que la constante ci en la descomposición ini¬ 
cial de xo es positiva cuando las entradas en xo son no negativas. Entonces, la población de 
búhos crecerá lentamente, con una tasa de crecimiento asintótica de 1.01. El vector propio Vi 
describe la distribución final de los búhos en sus etapas de vida: por cada 31 adultos, habrá 
10 juveniles y 3 subadultos. ■ 
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PROBLEMAS DE PRÁCTICA 

2 1 

1. La matriz A que se muestra a continuación tiene los valores propios 1, 3 y 3 con los 
vectores propios correspondientes vi, v 3 y v 3 : 


"7-2 0 


-2 


2 


1 " 

-2 6 2 

0 2 5 

, Vi = 

2 

1 

, v 2 = 

1 

2 

, v 3 = 

2 

-2 


Encuentre la solución general de la ecuación xjt+i = A x/¿ si xq 


1 

11 

-2 


2. ¿Qué ocurre en la secuencia {x^} del problema de práctica 1, conforme k —» °°? 


5.6 EJERCICIOS 


1. Sea A una matriz de 2 x 2 con valores propios 3 y 1/3, y vec¬ 


tores propios correspondientes Vi 


y v 2 


-1 

1 


. Sea 


{x*-} una solución de la ecuación en diferencias Xj. + i = Ax*, 


2. Suponga que los valores propios de A de 3 x 3 son 3, 4/5 y 



1 " 


2" 

3/5, con sus vectores propios correspondientes 

0 

, 

1 


-3 


-5 



a) Calcule = Ax 0 . [Sugerencia: No se necesita conocer A], 

tí) Determine una fórmula para x* que implique k y los vectores 
propios vi y v 2 . 


"-3 


"-2" 

-3 

7 

. Sea x 0 = 

-5 

3 


Encuentre la solución de la ecua¬ 


ción x¿+i = Ax* para xo especificado, y describa qué sucede 
cuando k —> 00 . 
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En los ejercicios 3 a 6, suponga que cualquier vector inicial xo tiene 
una descomposición de vectores propios tal que el coeficiente ci, en 
la ecuación (1) de esta sección, es positivo. 3 


3. Determine la evolución del sistema dinámico del ejemplo 1, 
cuando el parámetro de depredación p es .2 en la ecuación (3). 
(Dé una fórmula para x¿). ¿Crece o disminuye la población 
de búhos? ¿Qué se puede decir sobre la población de ratas de 
bosque? 

4. Determine la evolución del sistema dinámico del ejemplo 1, 
cuando el parámetro de depredación p es .125. (Dé una fórmu¬ 
la para xQ. Conforme el tiempo transcurre, ¿qué ocurre a los 
tamaños de las poblaciones de búhos y de ratas bosque? El sis¬ 
tema tiende hacia lo que algunas veces se denomina equilibrio 
inestable. ¿Qué piensa que pueda ocurrirle al sistema si algún 
aspecto del modelo (como las tasas de nacimiento o de depre¬ 
dación) cambiara ligeramente? 


5. En los antiguos bosques de abetos en Douglas, los búhos 
manchados cenan básicamente ardillas voladoras. Suponga 
que la matriz depredador-presa para esas dos poblaciones es 


A = 



.3 

1.2 


Demuestre que si el parámetro de depre¬ 


dación p es .325, entonces ambas poblaciones crecen. Estime 
la tasa de crecimiento a largo plazo y la proporción final entre 
búhos y ardillas voladoras. 


6. Demuestre que si el parámetro de depredación p del ejercicio 
5 es .5, entonces a final de cuentas desaparecerán tanto los bú¬ 
hos como las ardillas. Encuentre un valor de p para el cual am¬ 
bas poblaciones tienden a mantener niveles constantes. En este 
caso, ¿cuál es la proporción entre las dos poblaciones? 


7. Sea que A tiene las propiedades descritas en el ejercicio 1. 

a) ¿El origen es un atractor, un repulsor, o un punto silla del 
sistema dinámico Xjt + i = Ax¿? 

b) Encuentre las direcciones de mayor atracción y/o repulsión 
para este sistema dinámico. 

c) Haga una descripción gráfica del sistema, que indique las 
direcciones de mayor atracción o repulsión. Incluya un es¬ 
quema de varias trayectorias típicas (sin calcular puntos 
específicos). 


8. Determine la naturaleza del origen (atractor, repulsor o punto 
silla) para el sistema dinámico x¿+i = Ax* si A tiene las pro¬ 
piedades descritas en el ejercicio 2. Obtenga las direcciones 
de mayor atracción o repulsión. 


En los ejercicios 9 a 14, clasifique el origen como atractor, repulsor 
o punto silla del sistema dinámico x*+i = Ax*. Encuentre las direc¬ 
ciones de mayor atracción y/o repulsión. 


9. A = 


1.7 —.3 

- 1.2 .8 


10. A = 


.3 

-.3 


.4 

1.1 


3 Una de las limitaciones del modelo del ejemplo 1 es que ahí siempre existen 
vectores Xo de población inicial con entradas positivas, tales que el coeficiente 
Ci es negativo. La aproximación (7) aún es válida, pero las entradas en x* 
finalmente se vuelven negativas. 


11. 

A = 

1 1 

\ 

44* 

.5' 

L3_ 

12. 

A = 

.5 
_ —.3 

.6 

1.4 

13. 

A = 

i 

\ 

44* be 

1 1 

en un 

14. 

A = 

1 

\ 

44* 

.6" 

.7 



'.4 

0 .2“ 


' .1 " 


15. Sea A = 

.3 

.3 

.8 .3 

.2 .5 

. El vector = 

.6 

.3 

es un vector 


propio de A, y dos valores propios son .5 y .2. Construya 
la solución del sistema dinámico x¿ + i = Ax¿ que satisface 
xq = (0, .3, .7). ¿Qué sucede a x* conforme k —» °°? 


16. [M] Obtenga la solución general del sistema dinámico x^+i = 
Ax¿ cuando A es la matriz estocástica para el modelo Rent A Car 
de Hertz del ejercicio 16 de la sección 4.9. 

17. Construya un modelo matricial por etapas para una especie ani¬ 
mal que tiene dos etapas de vida: juvenil (hasta 1 año de edad) 
y adulto. Suponga que las hembras adultas cada año dan a luz 
a un promedio de 1.6 hembras juveniles. Cada año, el 30% de 
las hembras juveniles sobreviven para convertirse en adultos y 
el 80% de los adultos sobreviven. Para k & 0, sea x* = (j¡¡, a¿), 
donde las entradas en x* son los números de hembras juveniles 
y hembras adultas en el año k. 

a) Construya la matriz por etapas A tal que x*+i = Ax^ para 

k > 0. 

b) Demuestre que la población está creciendo, calcule la tasa 
de crecimiento final de la población y dé la razón final entre 
adultos y juveniles. 

c) [M] Suponga que inicialmente hay 15 hembras juveniles y 
10 hembras adultas en la población. Elabore cuatro gráfi¬ 
cas que muestren cómo cambia la población durante 8 años: 
a) el número de juveniles, b) el número de adultas, c) la po¬ 
blación total y d) \& razón entre adultas y juveniles (cada 
año). ¿Cuándo parece estabilizarse la razón en dfl Incluya 
una lista del programa o las instrucciones empleadas para 
realizar las gráficas en c) y d). 

18. Una manada de búfalos americanos (bisontes) se podría mode¬ 

lar con una matriz por etapas, similar a la empleada para los 
búhos manchados. Las hembras se pueden dividir en terneras 
(hasta 1 año de edad), becerras (de 1 a 2 años) y adultas. Supon¬ 
ga que un promedio de 42 hembras terneras nacen cada año 
por cada 100 adultas. (Tan solo las adultas tienen descendencia). 
Cada año sobreviven cerca del 60% de terneras, 75% de bece¬ 
rras y 95% de adultas. Para ISO, sea x¿ = (c*, a¡¡), donde 

las entradas en x* son los números de hembras en cada etapa 
de vida en el año k. 

a) Construya la matriz por etapas A para la manada de búfalos, 
tal que x*+i = Ax* para ISO. 

b) [M] Demuestre que la manada de búfalos está creciendo, 
determine la tasa de crecimiento esperada después de mu¬ 
chos años, y dé los números esperados de terneras y becerras 
por cada 100 adultas. 
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SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. El primer paso consiste en escribir xo como una combinación lineal de vi, \ 2 y V 3 . 
La reducción por filas de [v¡ v 2 V 3 xo] genera los pesos ci = 2, c 2 = 1 y C 3 = 3, 
tal que 

x 0 = 2vi + lv 2 + 3 v 3 

2 1 

Como los valores propios son 1, ¿ y 3 , la solución general es 



2. Conforme k —> el segundo y tercer términos en (12) tienden al vector cero, y 


x k = 2 Vi 4- 



-4 

4 

2 


5.7 APLICACIONES A ECUACIONES DIFERENCIALES 

Esta sección describe análogos continuos de las ecuaciones en diferencias estudiadas en la 
sección 5.6. En muchos problemas aplicados, algunas cantidades varían continuamente en el 
tiempo, y se relacionan mediante un sistema de ecuaciones diferenciales: 

x¡ = a nxi 4-1- a Xn x„ 

x' 2 = a 2 \X\ 4-b a 2n x„ 

X n — ü n \X\ 4“ ''' 4“ Q-nnXn 

Aquí vi,..., x„ son funciones diferenciables de t, con derivadas x¡,..., x’ , y las a¡j son cons¬ 
tantes. El aspecto esencial de este sistema es que es lineal. Para observarlo, escriba el siste¬ 
ma como una ecuación diferencial matricial 

x'(í) = Ax(t) (1) 

donde 



Xi (t) 


x[(t) 


a 11 

&\n 

x (0 = 


. x'(í) = 


y A = 




_X„ (t)_ 




_ &n\ 

ttnn _ 


Una solución de la ecuación (1) es una función valuada en vectores que satisface la ecuación 
( 1 ) para toda t en algún intervalo de números reales, tales como / > 0 . 

La ecuación (1) es lineal porque la derivación de funciones y la multiplicación de 
vectores por una matriz son transformaciones lineales. Así, cuando u y v son soluciones 
de x' = Ax, entonces cu 4- d\ también es una solución, porque 

(cu 4- c/v)' = cu' 4- dV 

= cAu 4- dAx = A(cu 4 - dv) 
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(A esta propiedad los ingenieros la denominan superposición de soluciones). Asimismo, la 
función idénticamente cero es una solución (trivial) de (1). En la terminología del capítulo 4, 
el conjunto de todas las soluciones de (1) es un subespacio del conjunto de todas las funciones 
continuas con valores en IR". 

Los libros estándar de ecuaciones diferenciales demuestran que siempre existe el con¬ 
junto fundamental de soluciones de (1). Si A es n x n, entonces hay n funciones linealmente 
independientes en un conjunto fundamental, y cada solución de (1) es una combinación lineal 
única de tales n funciones. Es decir, un conjunto fundamental de soluciones es una base para 
el conjunto de todas las soluciones de (1), y el conjunto solución es un espacio vectorial 
«-dimensional de funciones. Si se especifica un vector xo, entonces el problema con valores 
iniciales consiste en construir la función (única) x tal que x' = ,4x y x(0) = xo. 

Cuando A es una matriz diagonal, las soluciones de (1) se generan mediante cálculo 
elemental. Por ejemplo, considere 


x\(í) 


1 

O 

_ 1 

-1 

X 

_l 

1 

<N 

X 

_1 


-1 

m 

1 

O 

K> 

1_ 


es decir, 

x[{t) = 3 xi (t) 

x' 2 (t) = - 5 x 2 (t) 


Se dice que el sistema (2) está desacoplado porque cada derivada de una función tan solo 
depende de la propia función, y no de alguna combinación o “acoplamiento” de .rfir) y X 2 (í). 
De cálculo, las soluciones de (3) son .rfií) = c ¡e 3t y X 2 (t) = c 2 e 5í , para las constantes cuales¬ 
quiera Ci y ci- Cada solución de la ecuación (2) se escribe en la forma 


X\(t) 


cíe 3 ' 


" 1 " 


"o" 

_X 2 (t) _ 


_ c 2 e~ 5 ' _ 

= C\ 

0 

e + c 2 

1 



C 2 


Este ejemplo sugiere que para la ecuación general x' = Ax, una solución podría ser una 
combinación lineal de funciones con la forma 

x(r) = ve Aí (4) 

para algún escalar A y algún vector fijo v distinto de cero. [Si v = 0, la función x(t) es idén¬ 
ticamente cero y por lo tanto satisface x' = Ax]. Observe que 

x'(f) = Ave Aí Por Cálculo, ya que v es un vector constante 

Ax(f) = Ave A ' Multiplicando ambos lados de (4) por A 

Como e A ' nunca es cero, x'(f) será igual a Ax(f) si y solo si Av = Av, es decir, si y solo si A 
es un valor propio de A y v es un vector propio correspondiente. Así, cada par valor propio- 
vector propio ofrece una solución (4) de x' = Ax. Algunas veces dichas soluciones se conocen 
como funciones propias de la ecuación diferencial. Las funciones propias dan la clave para 
resolver sistemas de ecuaciones diferenciales. 

EJEMPLO 1 El circuito de la figura 1 se describe con la ecuación diferencial 


x\{t) 


~-(\/R, + \/R 2 )/C x 

1 /(RiCi) " 

X\ (f) 

x’ 2 (t) 


1 /(R2C2) 

-1/(^ 2 C 2 ) 

X 2 (t) 


donde x\(t) y x 2 (t) son los voltajes en los dos capacitores al tiempo t. Suponga que el resis¬ 
tor R\ es de 1 ohm, AS = 2 ohms, capacitor Cj = 1 farad, y C 2 = .5 farad; con cargas inicia¬ 
les de 5 volts en el capacitor Ci y de 4 volts en C 2 . Encuentre las fórmulas para x\(t) y x 2 (í) 
que describan cómo los voltajes cambian en el tiempo. 


FIGURA 1 
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SOLUCIÓN Sea que A denote la matriz mostrada arriba y sea x(f) = 


x\(t) 

Xi(t) 


. Para los 


datos dados, A 


-1.5 .5 

1 -1 


y x(0) 


. Los valores propios de A son Ai = -.5 y 


A 2 = —2, con los vectores propios correspondientes 


vi = 


y v 2 = 


Ambas funciones propias Xi(f) = V] e A,/ y x 2 (í) = satisfacen x' = Ax, y lo mismo 

ocurre con cualquier combinación lineal de x¡ y x 2 . Se hace 


x(í) = CiVié’ Alí + c 2 \ 2 e Xlt = c 1 


e ' 5 ' -I- c 2 


-1 

1 


- 2 1 


y observe que x(0) = ciVi + c 2 v 2 . De manera evidente, puesto que Vi y v 2 son linealmente 
independientes y por consiguiente generan IR 2 , ci y c 2 se determinan tal que x(0) sea igual 
a xq. En efecto, la ecuación 


c 1 


1 

2 


+ c 2 


-1 

1 


5 

4 


t t t 

Vi V 2 Xo 


conduce fácilmente a cq 
diferencial x' = Ax es 


3 y c 2 = —2. Por lo tanto, la solución deseada de la ecuación 


x(0 = 3 


1 

2 


e 


-.51 



e 


-21 


o bien. 


’*t(0" 


3e~- St + 2e~ 21 



6e~ 5t - 2e~ 2 ’ 


La figura 2 muestra la gráfica, o trayectoria, de x(f), para t > 0, junto con trayectorias para 
algunos otros puntos iniciales. Las trayectorias de las dos funciones propias xi y x 2 están en 
los espacios propios de A. 

Las funciones x¡ y x 2 decaen a cero cuando t —» °°, pero los valores de x 2 decrecen más 
rápido porque su exponente es más negativo. Las entradas en el vector propio correspondien¬ 
te v 2 muestran que los voltajes en los capacitores decaerán a cero tan rápido como sea posi¬ 
ble, si los voltajes iniciales son iguales en magnitud pero opuestos en signo. ■ 



FIGURA 2 El origen como un atractor. 
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En la figura 2, el origen es un atractor o sumidero del sistema dinámico porque todas 
las trayectorias caen al origen. La dirección de mayor atracción está sobre la trayectoria de la 
función propia X 2 (a lo largo de la recta que pasa por 0 y V 2 ) correspondiente al valor propio 
más negativo, A = —2. Las trayectorias que inician en puntos fuera de esta recta se convierten 
en asíntotas a la recta que pasa por 0 y vi, ya que sus componentes en la dirección V 2 decaen 
muy rápidamente. 

Si los valores propios del ejemplo 1 fueran positivos en vez de negativos, las trayectorias 
correspondientes serían similares en forma, aunque las trayectorias estarían alejándose del 
origen. En tal caso, el origen es un repulsor, o fuente, del sistema dinámico, y la dirección 
de mayor repulsión es la recta que contiene la trayectoria de la función propia asociada con 
el valor propio más positivo. 


EJ EM PLO 2 Suponga que una partícula se mueve en un campo de fuerza plano y que su 
vector de posición x satisface x' = Ax y x(0) = xq, donde 


A = 




Xo = 


2.9 

2.6 


Resuelva este problema de valor inicial para t > 0, y bosqueje la trayectoria de la partícula. 

SOLUCION Los valores propios de A resultan ser Ai = 6 y A 2 = — 1, con los vectores propios 
correspondientes vi = (—5, 2) y V 2 = (L 1). Para cualesquiera constantes Ci y C 2 , la función 


x(f) = c\\\e Xlt + C 2 \ie X2t 


'-5' 

6/ 1 

' 1' 

2 

e + c 2 

1 


es una solución de x' = Ax. Se requiere que y C2 satisfagan x(0) = xq, es decir. 


'-5' 


' r 


'2.9' 


'-5 r 

C\ 


'2.9' 

2 

+ Cl 

1 


2.6 

0 

2 1 

_ c 2 _ 


2.6 


Los cálculos demuestran que ci = —3/70 y C 2 = 188/70, y así la función deseada es 


x(í) 


-3 

'-5' 


188 

' r 

70 

2 

e b! + 

70 

1 


f n la figura 3 se ilustran las trayectorias de x y otras soluciones. 


En la figura 3, el origen es un punto silla del sistema dinámico porque algunas tra¬ 
yectorias primero se acercan al origen y, después, cambian de dirección y se alejan de él. 
Un punto silla se presenta cuando la matriz tiene valores propios tanto positivos como nega¬ 
tivos. La dirección de mayor repulsión es la recta que pasa por vi y 0, asociada con el valor 
propio positivo. La dirección de mayor atracción es la recta que pasa por V 2 y 0, correspon¬ 
diente al valor propio negativo. 



FIGURA 3 El origen como un punto silla. 
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Desacoplamiento de un sistema dinámico 

El siguiente análisis muestra que el método de los ejemplos 1 y 2 produce un conjunto fun¬ 
damental de soluciones para cualquier sistema dinámico descrito por x' = Ax cuando A es de 
n x n y tiene n vectores propios linealmente independientes, es decir, cuando A es diagona- 
lizable. Suponga que las funciones propias para A son 


con vi,..v„ vectores propios linealmente independientes. Sean P = [v¡ • • • v„] y D la matriz 
diagonal con entradas Ai,..., A,¡ tal que A = PDP 1 . Ahora se hace un cambio de variable, 
definiendo una nueva función y por 

y(f) = P~ 1 x(t) o, de manera equivalente, x(f) = Py(t) 


La ecuación x(r) = Py(t) indica que y (t) es el vector de coordenadas de x(í) respecto a la 
base de vectores propios. La sustitución de Py para x en la ecuación x' = Ax da 


d 

dt 


(Py) = A(Py) = (PDP- V )P y = PDy 


( 5 ) 


Como P es una matriz constante, el lado izquierdo de (5) es Py'. Ambos lados de (5) se mul¬ 
tiplican por la izquierda por P 1 y se obtiene y' = Dy, o bien, 


y'Áty 


"Ai 0 

0 " 


" jiá) 

y'i(t ) 

= 

... O 

SJ 

0 


y 2(0 

y'nit). 


Lo ... 

0 A„ _ 


_yn(t)_ 


El cambio de variable de x a y desacopló el sistema de ecuaciones diferenciales, porque 
la derivada de cada función escalar y/, tan solo depende de y*. (Revise el cambio de variables 
análogo de la sección 5.6). Como y ' = Aiyi, se tiene que yi(f) = c\e Xlt , con fórmulas simi¬ 
lares para y 2 ,..., y„. Así, 



1 

1 _ 


C\ 

y(0 = 


, donde 



1 

K 

O 

_1 


_ Cn 


= y(0) = R -1 x(0) = P 


-i. 


Xo 


Para obtener la solución general x del sistema original, calcule 


x(0 = Py(t) = [ V! ••• v„]y(í) 
= c\\\e llt -\ -h c„\„e Xnt 


Este es el desarrollo de funciones propias construidas como en el ejemplo 1. 


Valores propios complejos 

En el siguiente ejemplo, una matriz real A tiene un par de valores propios complejos A y A, 
con vectores propios complejos asociados vyv. (Recuerde de la sección 5.5 que para una 
matriz real, los valores propios complejos y sus vectores propios correspondientes se pre¬ 
sentan en pares conjugados). Entonces, dos soluciones de x' = Ax son 

x x (t) = \e Xt y x 2 (t) = \e Xt (6) 

Utilizando una representación en serie de potencias de la función exponencial compleja 
se demuestra que x 2 (t) = Xi(í). No obstante que las funciones propias complejas X| y X2 
son convenientes para algunos cálculos (sobre todo en ingeniería eléctrica), las funciones 
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reales son más adecuadas para diversos fines. Afortunadamente, las partes real e imaginaria 
de xi son soluciones (reales) de x' = Ax, porque son combinaciones lineales de las solucio¬ 
nes de (6): 

Re(vé> A ') = i[xi(0 + MÓ], Im(ve Aí ) = ^r[xi(í) - xj(f) ] 

Para entender la naturaleza de Re(ve A '), recuerde que en cálculo para cualquier número x, 
la función exponencial e x se determina mediante la serie de potencias: 

1 , 1 

e x = l+x + -X 2 + • • • + — x n + ■■■ 

2! n\ 

la cual se utiliza para definir e Xt cuando A es complejo: 

e lr = 1 + (Af) + ^-(Aí) 2 + • • • + —(Xt) n + ■■■ 

2 ! n ! 

Escribiendo A = a + bi (con ay b reales), y utilizando series de potencias similares para las 
funciones coseno y seno, se obtiene que 

e (a+bi)t _ £ at . £ ibt _ g a '( cos ¿¿ / sen ¿f) (7) 

Por lo tanto, 

xe Xt = (Rev + i Imv) • e at (eos bt + i sen bt) 

= [ (Rev) eos¿í — (Imv)senAr ]e at 
+ i [ (Re v) sen bt + (Im v) eos bt ]e at 

Entonces, dos soluciones reales de x' = Ax son 



L 


FIGURA 4 


yi(f) = Re xi (t) = [(Re v) eos bt — (Im v) sen bt]e a ' 
y i(t) = Im xi(f) = [(Re v) sen bt + (Im v) eos bt]e at 

Se puede demostrar que y i y y 2 son funciones linealmente independientes (cuando b ¥= O ). 1 


EJEMPLO 3 El circuito de la figura 4 se describe con la ecuación 




~-r 2 /l -\/L 

ÍL 

v c 


1 /C —1/ (R\C) 

V C 


donde i L es la corriente que pasa en el inductor L y v c es la caída de voltaje en el capacitor 
C. Suponga que R¡ = 5 ohms, AS = .8 ohms, C = .1 farad y L = .4 henry. Encuentre las 
fórmulas para i¡ y v c , si la corriente inicial en el inductor es 3 amperes y el voltaje inicial 
en el capacitor es 3 volts. 


SOLUCIÓN Para los datos dados, A 


-2 -2.5 
10 -2 


y x 0 


. El método analizado 


en la sección 5.5 produce el valor propio A = —2 + 5 i y el vector propio correspondiente 
i 


vi = 


. Las soluciones complejas de x' = Ax son combinaciones lineales complejas de 


xi(0 = 


1 

2 


e (—2+5 i)t 


y 


x 2 (í) = 



e (—2-5 i)t 


1 Puesto que X 2 (í) es el complejo conjugado de Xi(í), las partes real e imaginaria de X 2 (í) son_yi(í) y — y2(0> respec¬ 
tivamente. Entonces, se utiliza ya sea X[(í) o X 2 (f), P ero no ambas, para producir dos soluciones reales linealmente 
independientes de x' = Ax. 
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Ahora, utilice la ecuación (7) para escribir 


xi(0 = 


1 

2 


e 2í (cos 5 1 + i sen 5 i) 


Las partes real e imaginaria de xi dan soluciones reales: 


FIGURA 5 

El origen como un punto espiral. 


yi(0 = 


—sen 5 1 
2 eos 5t 


e 


- 2 1 


y 2 (0 = 


eos 5 1 
2 sen 5 1 


e 


- 2 1 


Como yi y y 2 son funciones linealmente independientes, forman una base para el espacio 
vectorial bidimensional real de soluciones de x' = Ax. Así, la solución general es 


x(í) = Ci 



— sen 5 1 

—2 1 x 

eos 5 1 

O 

2 eos 5 1 

e + C 2 

2 sen 5 1 


- 2 1 


Para satisfacer x(0) 


3" 


"O" 


' i" 

3 

, se necesita Ci 

2 

+ ¿2 

0 


y C 2 = 3. Por lo tanto. 


3 

3 


, lo que conduce a ci 


1.5 


o bien. 


x(f) = 1.5 


— sen 5? 

—9 1 . 

eos 5 1 

2 eos 5 1 

e + 3 

2 sen 5 1 


e 


—2t 


' Íl( t) ' 


— 1.5sen5f + 3 eos 5 1 



3 eos 5 1 + 6sen5f 


Véase la figura 5. 


En la figura 5, el origen es un punto espiral del sistema dinámico. La rotación es causada 
por las funciones seno y coseno provenientes de un valor propio complejo. Las trayectorias 
en espiral entran, ya que el factor e 2l tiende a cero. Recuerde que —2 es la parte real del 
valor propio del ejemplo 3. Cuando A tiene un valor propio complejo con parte real positiva, 
entonces las trayectorias en espiral son hacia fuera. Si la parte real del valor propio es cero, 
las trayectorias forman elipses alrededor del origen. 


PROBLEMAS DE PRÁCTICA 

A es una matriz real de 3 x 3 con valores propios —.5, .2 + ,3¡, y .2 — .3 i, y vectores pro¬ 
pios correspondientes 



r 


" 1 + 2i ” 


"1-2 i~ 

Vi = 

-2 

1 

, v 2 = 

4/ 

2 

y v 3 = 

-4/ 

2 


1. ¿A es diagonalizable como A = PDP *, utilizando matrices complejas? 

2. Escriba la solución general de x' = Ax utilizando funciones propias complejas y, después, 
encuentre la solución general real. 

3. Describa las formas de las trayectorias típicas. 


5.7 EJERCICIOS 

1. Una partícula que se mueve bajo un campo de fuerza plano tiene 
un vector de posición x que satisface x' = Ax. La matriz A de 
2x2 tiene valores propios 4 y 2, con sus vectores propios aso¬ 


ciados Vi = 



y v 2 


. Encuentre la posición de 


la partícula al tiempo t, suponiendo que x(0) = 
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2. Sea A una matriz de 2 x 2 con valores propios —3 y —1 con 


vectores propios asociados Vi 


-1 

1 


y v 2 


. Sea x(f) 


la posición de una partícula al tiempo r. Resuelva el problema 

' 2 " 

de valor inicial x' = Ax, x(0) = 1 


En los ejercicios 3 a 6 , resuelva el problema de valor inicial 
x'(t ) = Ax(t ) para í£ 0, con x(0) = (3, 2). Clasifique la naturaleza 
del origen como un atractor, repulsor o punto silla del sistema di¬ 
námico descrito por x' = Ax. Encuentre las direcciones de mayor 
atracción y/o repulsión. Cuando el origen sea un punto silla, dibuje 
trayectorias típicas. 


3. A = 

5. A = 


2 3 

-1 —2 

7 -1" 

3 3 


4. A = 

6. A = 


-2 -5 

1 4 

1 - 2 " 
3 -4 




'-6 

-11 

161 

16. 

[M] A = 

2 

5 

-4 




-4 

-5 

10 




30 

64 

23 

17. 

[M] A = 

-11 

-23 

- 

9 



6 

15 


4 



'53 

-30 

- 2 " 


18. 

[M] A = 

90 

-52 

-3 




20 

-10 

2 



19. [M] Encuentre fórmulas para los voltajes v\ y u 2 (como funcio¬ 
nes del tiempo i) en el circuito del ejemplo 1 , suponiendo que 
R\ = 1/5 ohm, Ri = 1/3 ohm, Ci = 4 farads, C 2 = 3 farads, y 
el voltaje inicial en cada capacitor es 4 volts. 

20. [M] Obtenga fórmulas para los voltajes tq y v 2 en el circuito 
del ejemplo 1, suponiendo que Ri = 1/15 ohm, R 2 = 1/3 ohm, 
Ci = 9 farads, C 2 = 2 farads y el voltaje inicial sobre cada ca¬ 
pacitor es 3 volts. 


En los ejercicios 7 y 8 , haga un cambio de variable que desaco¬ 
ple la ecuación x' = Ax. Escriba la ecuación x(t) = Py(l) y muestre 
el cálculo que conduce al sistema desacoplado y' = Dy , especifi¬ 
cando P y D. 

7. A como en el ejercicio 5. 8. A como en el ejercicio 6 . 


21. [M] Encuentre fórmulas para la corriente i L y el voltaje ve 
para el circuito del ejemplo 3, suponiendo que R¡ = 1 ohm, 
R 2 = .125 ohm, C — .2 farad, L = .125 henry, la corriente ini¬ 
cial es 0 amp y el voltaje inicial es 15 volts. 

22. [M] El circuito en la figura se describe por la ecuación 


En los ejercicios 9 a 18, construya la solución general de x' = Ax que 
implique funciones propias complejas y, después, determine la solu¬ 
ción general real. Describa las formas de trayectorias típicas. 


9. A = 

11. A = 

13. A = 



15. [M] A = 


-8 -12 

2 1 

7 12 


10. A = 


12. A = 


14. A = 


-6 

2 

5 


3 

-2 

-7 

-4 

-2 

-8 


1 

1 

10 

5 

1 " 

2 




0 

l/L 

ÍL 

_ V C _ 


— !/C 

-1 /(RC) 

Ve 


donde i L es la corriente en el inductor L y ve es la caída de 
voltaje en el capacitor C. Obtenga fórmulas para i L y vq cuan¬ 
do R = .5 ohm, C = 2.5 farads, L = .5 henry, la corriente inicial 
es 0 amp y el voltaje inicial de 12 volts. 

—*■— -Nt- - 

R 

- 

C 

— - 

L 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Sí, la matriz de 3 x 3 es diagonalizable ya que tiene tres valores propios distintos. El teo¬ 
rema 2 de la sección 5.1 y el teorema 5 de la sección 5.3 son válidos cuando se utilizan 
escalares complejos. (Las pruebas son esencialmente las mismas que para los escalares 
reales). 

2. La solución general tiene la forma 



1 


" 1 + 2 / 


~1 - 2 / ~ 

x(0 = Ci 

-2 

1 

e ' 51 + c 2 

4 / 

L 2 

e (.2+.3 ¿) r + C3 

-Ai 

L 2 


Aquí los escalares C\, c 2 , C 3 pueden ser números complejos cualesquiera. El primer 
término en x(r) es real. Es posible obtener dos soluciones reales adicionales utilizando 
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las partes real e imaginaria del segundo término en x(f): 


1 + 2 / 
4 i 
2 


e 2 ' (eos .3t + i sen ,3í) 


La solución general real tiene la siguiente forma, con escalares reales c\, C 2 , cy 


C 1 

1 ' 
-2 

e 51 + c 2 

eos ,3í —2 sen.3í 

—4 sen .3 1 

e 2t + c 3 

sen.3f + 2 eos .3 1 

4 eos .3 1 


1 


2 eos 3t 


2 sen .3/ 


3. Cualquier solución con C 2 = C 3 = 0 es atraída hacia el origen debido al factor exponen¬ 
cial negativo. Otras soluciones tienen componentes que crecen sin cota, en tanto que las 
trayectorias son espirales hacia afuera. 

Sea cuidadoso para no confundir este problema con el de la sección 5.6. Ahí la con¬ 
dición para atracción hacia 0 fue que un valor propio era menor que 1 en magnitud, para 
que |A|* —» 0. Aquí la parte real del valor propio debe ser negativa, para que e ÁI —» 0. 


5.8 ESTIMACIONES ITERATIVAS PARA VALORES PROPIOS 

En las aplicaciones científicas del álgebra lineal, los valores propios rara vez se conocen 
con precisión. Por fortuna, una aproximación numérica cercana es bastante satisfactoria. 
En efecto, algunas aplicaciones tan solo requieren una aproximación burda al valor propio 
más grande. El primer algoritmo que se describe abajo sirve muy bien para este caso. Además, 
proporciona un fundamento para un método más poderoso que también aportaría estima¬ 
ciones rápidas para los valores propios restantes. 

El método de potencias 

El método de potencias se aplica a una matriz A de n x n, con un valor propio estrictamente 
dominante Ai, lo cual significa que Ai debe ser, en valor absoluto, mucho más grande que 
todos los demás valores propios. En tal caso, el método de potencias produce una secuen¬ 
cia escalar que se aproxima a Ai y una secuencia vectorial que se aproxima al vector propio 
correspondiente. El antecedente para el método es la descomposición de vectores propios que 
se utilizó al inicio de la sección 5.6. 

Por sencillez, suponga que A es diagonalizable y que R" tiene una base de vectores 
propios vi,..., v„, colocados de manera que los valores propios correspondientes Ai,..., A„ 
disminuyan de tamaño, con el primer valor propio estrictamente dominante. Es decir, 


|Ai| > |A 2 | > |A 3 | >•••> |A„| (1) 

*— estrictamente mayor 

Como se vio en la ecuación (2) de la sección 5.6, si x en R" se escribe en la forma 
x = C 1 V 1 + ••• + c„v„, entonces, 

A k x = ci(Ai)*Vi + C 2 (A 2 ) A 'V 2 +-f c n (X„) k \ n (k = 1,2,...) 

Suponga que + 0. Por lo tanto, dividiendo entre (Ai)*, 

De la desigualdad (1), las fracciones A 2 /A 1 ,..., A„/A! son menores que 1 en magnitud y por 
ende sus potencias tienden a cero. Así, 

(Ai )~ k A k x —>■ C 1 V 1 como k —*■ 00 


( 3 ) 
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De manera que para k grande, un escalar múltiplo de A k x casi determina la misma dirección 
como el vector propio ciVi. Puesto que un múltiplo escalar positivo no cambia la dirección de 
un vector, entonces A k x casi apunta en la misma dirección que Vi o —Vi, si C\ ¥= 0 . 


EJEMPLO 1 


Sean A = 


1.8 

.8' 


'4' 


"-.5" 

.2 

1.2 

, Vi = 

1 

y x = 

1 


. Entonces, A tiene 


los valores propios 2 y 1, y el espacio propio para Ai = 2 es la línea que pasa por 0 y vi. 
Para k = 0,..., 8, calcule A k x y construya la línea por 0 y A k x. ¿Qué sucede conforme k se 
incrementa? 


SOLUCIÓN Los primeros tres cálculos son 


Ax = 

1.8 

.2 

.8 

1.2 

-.5 

1 

= 

-.1 

1.1 

A 2 x = A(Ax) = 

' 1.8 

.2 

.8' 

1.2 

"-.r 

í.i 

= 

.7 

1.3 

A 3 x = A(A 2 x) = 

' 1.8 

.2 

.8' 

1.2 

.7" 

1.3 

= 

N> 

^ u> 

_1 


Cálculos semejantes permiten elaborar la tabla 1. 


TABLA 1 Iteración de un vector 


k 

0 12345 6 7 8 

A k x 


" —.5" 

1 


'-.f 

1.1 


.7' 
_ 1.3 


'2.3' 
_ 1.7 _ 


'5.5' 
_ 2.5 _ 


' 11.9' 
4.1 


r-~ m 

CN 


'50.3' 
_ 13.7 


' 101.5" 
26.5 


En la figura 1 se ilustran los vectores x, Ax,..., A 4 x. Los otros crecen demasiado y se 
dificulta dibujarlos. Sin embargo, se han trazado segmentos de recta para mostrar las di¬ 
recciones de esos vectores. En efecto, las direcciones de los vectores es lo que realmente 
se desea observar, no los vectores mismos. Las rectas parecen aproximarse a la recta que 
representa el espacio propio generado por vi. Más precisamente, el ángulo entre la recta (sub¬ 
espacio) determinada por A k x y la recta (espacio propio) definida por vi tiende a cero cuan¬ 
do £ —» °o. ■ 


Ax 


A 4 x 


|A 2 x 

1 


As 


Espacio propio 


+ 


+ 


H-*i 

10 


1 4 

FIGURA 1 Direcciones determinadas por x, Ax, A 2 x,..., A 7 x. 


Se escalan los vectores (A|) k A k x en la ecuación (3) para hacerlos converger a CiVi, si 
Ci ¥= 0. No se puede escalar A k x en esta forma porque se desconoce Ai. Sin embargo, sí es 
posible escalar cada A k x para hacer que su entrada sea 1. Entonces, resulta que la secuencia 
{JCyt} convergerá a un múltiplo de V| cuya mayor entrada es 1. La figura 2 muestra la secuen- 
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cia escalada para el ejemplo 1. El valor propio Ai también se estima a partir de la secuencia 
¡Xi}. Cuando se acerca a un vector propio para Ai, el vector Ax¡ c está cerca de A¡X&, con 
cada entrada en Ax¡ ( aproximadamente igual a Ai veces la entrada correspondiente en X/,. 
Como la entrada más grande en x¿ es 1, por lo tanto, la mayor entrada en Ax¡- es casi Ai. 
(Se omiten pruebas cuidadosas de estos enunciados). 



FIGURA 2 Múltiplos escalados de x, Ax, A 2 x ,..., A 7 x. 


MÉTODO DE POTENCIAS PARA ESTIMAR UN VALOR PROPIO ESTRICTAMENTE 
DOMINANTE 

1. Seleccione un vector inicial xo cuya entrada más grande sea 1. 

2. Para k = 0, 1,..., 

«) Calcule Ax/-. 

b) Sea una entrada en Ax¿- cuyo valor absoluto es tan grande como sea posible. 

c) Determine xa.+i = (1 //i k )Ax k . 

3. Para casi todas las elecciones de xo, la secuencia { ¡ik ¡ se aproxima al valor propio 
dominante, y la secuencia {x/1 tiende a un vector propio correspondiente. 


EJEMPLO 2 Aplique el método de potencias a A 


6 5 

1 2 


con xq 


cuando k = 5, y estime el valor propio dominante y un vector propio correspondiente 
de A. 

SOLUCIÓN Los cálculos en este ejemplo y en el siguiente fueron realizados con MATLAB, 
que calcula con 16 dígitos de exactitud, no obstante que aquí tan solo se muestran pocos deci¬ 
males. Para comenzar, calcule Axq e identifique la entrada más grande ¡Mi en Axq: 


, r6 si roí r51 

° = Ll 2 J |_ 1 J = |_2_’ 


/x o = 5 


Escale Axq por 1 //j , 0 para obtener xi, calcule Ax! e identifique la mayor entrada en Axi: 


1 , 1 r 5 i r 1 

Mo 5 [ 2 J [ .4 

_ r 6 51 r 11 _ r s - 
^ Xl _ L 1 2 J L .4 J _ L 1.8 J’ 


/X 1 = 8 


Escale Ax; por 1 /¡i\ para obtener X2, determine Ax2 e identifique la mayor entrada en AX2: 


1 , si r 

¡x\ 8 [ i.o J 

_[ 6 5 ir 1 ir 7.125' 

2 “ [ 1 2 J |_ .225 J — 1 _ 1 -450 J ’ 


fi 2 = 7.125 
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Escale Ax 2 por I / ¡ii para obtener X3, y así sucesivamente. Los resultados de los cálculos 
con MATLAB para las primeras cinco iteraciones se dan en la tabla 2. 


TABLA 2 Método de potencias para el ejemplo 2 


k 

0 

1 

2 

3 

4 

5 

Xfc 


"0" 


" 1 " 


1 


1 


1 


1 


1 


.4 


.225 


.2035 


.2005 


.20007 

Ax k 


'5' 


8 ' 


'7.125' 


'7.0175' 


' 7.0025' 


' 7.00036' 


2 


_ 1.8 _ 


1.450 


1.4070 


1.4010 


1.40014 

Bk 

5 

8 

7.125 

7.0175 

7.0025 

7.00036 


La evidencia de la tabla 2 sugiere significativamente que {x¿,} se aproxima a (1, .2) y 
que {/Ai-} se aproxima a 7. Si es así, entonces (1, .2) es un vector propio y 7 es el valor propio 
dominante. Esto se comprueba fácilmente calculando 



La secuencia { ¡i k } del ejemplo 2 tuvo convergencia rápida a Ai = 7 porque el segun¬ 
do valor propio de A fue mucho más pequeño. (En efecto, A2 = 1). En general, la rapidez de 
convergencia depende de la razón |A2/Ai|, porque en la ecuación (2) el vector 02 (^ 2 / \\fv 2 
es la principal fuente de error, cuando se utiliza una versión escalada de A k x como un es¬ 
timador de c: 1 v 1. (Las otras fracciones A,/A ¡ son mucho más pequeñas). Si IA2/A1I es cercana 
a 1, entonces {/x¿.} y {X/ f ¡ pueden converger muy lentamente y se preferirían otros métodos 
de aproximación. 

Con el método de potencias, hay una leve posibilidad de que el vector inicial elegido x 
no tenga componente en la dirección v¡ (cuando C\ = 0). Pero el error de redondeo compu- 
tacional durante los cálculos de x¿ podría crear un vector con al menos una pequeña com¬ 
ponente en la dirección de Vi. Si eso ocurre, entonces x¿. empezará a converger a un múltiplo 
de Vi. 


Método de potencias inverso 

Este método brinda una aproximación para cualquier valor propio, si se tiene una buena 
estimación inicial a del valor propio A. En tal caso, sea B = (A — a/) -1 y se le aplica el 
método de potencias a B. Se puede demostrar que si los valores propios de A son Ai,..., A,„ 
entonces los valores propios de B son 

1 1 1 

Ai—a' A 2 — a ’ ’ A„ — a 


y los vectores propios correspondientes coinciden con los de A. (Véase los ejercicios 
15 y 16). 

Suponga, por ejemplo, que a está más cerca de A2 que de los otros valores propios de A. 
Entonces, 1 /(A2 — a) será un valor propio estrictamente dominante de B. Si a está realmen¬ 
te cerca de A2, entonces 1 /(A2 — a) será mucho mayor que los demás valores propios de B, 
y el método de potencias inverso produce una aproximación rápida a A2 para casi todas las 
elecciones de xq. El siguiente algoritmo presenta los detalles. 
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MÉTODO DE POTENCIAS INVERSO PARA ESTIMAR UN VALOR PROPIO A DE A 

1. Seleccione una estimación inicial A lo suficientemente cerca a A. 

2 . Elija un vector inicial Xo cuya entrada más grande sea 1 . 

3 . Para k = 0 , 1 ,..., 

a) Resuelva (A — al )y k = x/ : para y k . 

b ) Sea fji¡ una entrada en y k cuyo valor absoluto es tan grande como sea posible. 

c) Calcule Vk = a + (\/¡ik)- 

d) Determine x^+i = (\/ii k )y k . 

4. Para casi todas las elecciones de Xo, la secuencia {v/,} se aproxima al valor propio 
A de A, y la secuencia {x¿.} tiende a un vector propio correspondiente. 


Observe que B , o bien (A — a/) -1 , no se encuentra en el algoritmo. En vez de calcular 
(A — aI)~ l Xk para obtener el siguiente vector en la secuencia, es mucho mejor resolver 
la ecuación (A — al)y k = x/ f para y k (y después escalar y* para producir x¿ + i). Como esta 
ecuación para y k se debe resolver para cada k, entonces una factorización LU de A - a! 
acelerará el proceso. 


EJEMPLO 3 En algunas aplicaciones no es poco común necesitar conocer el valor pro¬ 
pio más pequeño de una matriz A y tener a mano estimaciones burdas de los valores propios. 
Suponga que 21, 3.3 y 1.9 son estimaciones para los valores propios de la matriz A que se 
muestra a continuación. Encuentre el valor propio más pequeño, exacto a seis decimales. 


A = 



-8 -4 
13 4 

5 4 


SOLUCIÓN Los dos valores propios menores parecen estar cercanos entre sí, de modo que 
se emplea el método de potencias inverso para A — 1 .91. La tabla 3 muestra los resultados de 
los cálculos obtenidos con MATLAB. Aquí Xo se eligió arbitrariamente, y k = (A — 1 .91) 1 X/., 
fjk es la entrada más grande en y V/ ( = 1.9 + I //a¡ ( y x¿+i = (I /¡iAyk- Resulta que la esti¬ 
mación inicial del valor propio fue muy buena y la secuencia de potencias inversa convergió 
de manera rápida. El valor propio más pequeño es exactamente 2. ■ 


TABLA 3 Método de potencias inverso 


0 

1 

2 

3 

4 

' 1" 
1 

1 


".5736" 

.0646 

1 


".5054" 

.0045 

1 


" .5004 ' 
.0003 

1 


" .50003 ' 
.00002 

1 


"4.45" 


"5.0131 " 


"5.0012“ 


" 5.0001 " 


" 5.000006 " 

.50 


.0442 


.0031 


.0002 


.000015 

7.76 


9.9197 


9.9949 


9.9996 


9.999975 


dk 7.76 

v k 2.03 


9.9197 

2.0008 


9.9949 9.9996 9.999975 

2.00005 2.000004 2.0000002 


Si no se dispone de una estimación para el valor propio más pequeño de una matriz, 
se puede simplemente tomar a = 0 en el método de potencias inverso. Esta elección de a 
funciona razonablemente bien, cuando el valor propio más pequeño está mucho más cerca 
de cero que los demás valores propios. 
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Los dos algoritmos presentados en esta sección son herramientas prácticas para muchas 
situaciones simples, y brindan una introducción al problema de la estimación de valores pro¬ 
pios. Un método iterativo más robusto y ampliamente utilizado es el algoritmo QR. Por ejem¬ 
plo, este es el corazón del comando eig (A) de MATLAB, que rápidamente calcula valores 
propios y vectores propios de A. En los ejercicios de la sección 5.2 se presenta una breve 
descripción del algoritmo QR. En casi todos los libros modernos de análisis numérico se 
presentan más detalles. 


PROBLEMA DE PRÁCTICA 


¿Cómo se podría decidir si un vector x dado es una buena aproximación a un vector propio 
de una matriz A? Si lo es, ¿cómo se estimaría el valor propio correspondiente? Experimente 
con 


"5 

8 

4 


1 .0" 

8 

3 

-1 

y x = 

-4.3 

4 

-1 

2 


8.1 


5.8 EJERCICIOS 


En los ejercicios 1 a 4, la matriz A va seguida por una secuencia {x¿} 
generada por el método de potencias. Utilice esos datos para estimar 
el mayor valor propio de A, y dé un vector propio correspondiente. 



1 

.3326 


1 


1 


1 


1 


0 

’ 

.25 

' 

.3158 

’ 

.3298 

' 


' r 


'-.5625' 


'-.3021 ' 


"-.2601" 


'-.2520' 

0 

’ 

1 

’ 

1 

’ 

1 

' 

1 



" 1 ' 


" 1 ' 


'.6875" 


'.5577" 


".5188" 

0 

’ 

.8 

' 

1 

’ 

1 

’ 

1 


4. A = 


4.1 

3 


-6 

-4.4 


" 1 " 


1 


1 


1 


1 

’ 

.7368 

’ 

.7541 

' 

.7490 

’ 


5. Sea A = 

15 

16" 

. Los vectores x,.. 

., A 5 x son 

' 1 " 


-20 

-21 



1 


31' 


—191 


991' 


'-4991 ' 


24991' 

-41 

’ 

241 

’ 

-1241 

' 

6241 

’ 

-31241 


Encuentre un vector con un 1 en la segunda entrada que sea 
cercano a un vector propio de A. Use cuatro lugares decimales. 
Compruebe su respuesta y dé una estimación para el valor pro¬ 
pio dominante de A. 


6 . 


Sea A = 


-2 

6 


-3 

7 


. Repita el ejercicio 5, utilizando la si¬ 


guiente secuencia x, Ax,..., A 5 x. 

-2045 
4093 


1 


-5 


-29 


-125 


-509 


1 

’ 

13 

’ 

61 

’ 

253 

' 

1021 

’ 


[M] Los ejercicios 7 a 12 requieren MATLAB u otra herramienta 
computacional. En los ejercicios 7 y 8 , utilice el método de potencias 
con xo dado. Liste ¡x*} y {¿/¿j para k— 1,..., 5. En los ejercicios 9 y 
10 , indique y 



r 6 71 


' 1" 

7. A = 

1 

00 1 

Lh 

1_ 

, X 0 = 

0 


Í2 1 1 


' 1' 

8. A = 

1 

1 

Ur > 

1_ 

, X 0 = 

0 



"8 

0 

12 “ 


" 1 “ 

9. A = 

1 

-2 

1 

,x 0 = 

0 


0 

3 

0 


0 



" 1 

2 

- 2 " 


" 1 “ 

10. A = 

1 

1 

9 

, x 0 = 

0 


0 

1 

9 


0 


Otra estimación se puede realizar para un valor propio cuando está 
disponible un vector propio aproximado. Observe que si Ax = Ax, 
entonces x'Ax = x r (Ax) = A(x T x), y el cociente de Rayleigh 


x T Ax 

R(x) = — 

x' X 

es igual a A. Si x es cercano a un vector propio para A, entonces este co¬ 
ciente es cercano a A. Cuando A es una matriz simétrica (A r = A), el 
cociente de Rayleigh R(xQ = (x¿ Ax*)/(x£x¡t) tendrá aproximada¬ 
mente el doble de dígitos de exactitud que el factor de escalamiento 
fxi¡ en el método de potencias. En los ejercicios 11 y 12 compruebe el 
aumento de precisión mediante el cálculo de ¿14 y R{xi<) para k— 1„.., 4. 
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5 

2 ' 


' f 

2 

2 

, x 0 = 

_ 0 _ 



L 

j 

L 

J 


"-3 

2 " 


" 1 ' 

A = 

2 

0 

, Xo = 

0 


Los ejercicios 13 y 14 se aplican a una matriz A de 3 x 3 cuyos valo¬ 
res propios se estiman como 4, —4 y 3. 

13. Si se conoce que los valores propios cercanos a 4 y —4 tienen 
diferentes valores absolutos, ¿funcionará el método de poten¬ 
cias? ¿El método continúa siendo útil? 

14. Suponga que se conoce que los valores propios cercanos a 4 
y —4 tienen exactamente el mismo valor absoluto. Describa 
cómo se podría obtener una secuencia que estime el valor pro¬ 
pio cercano a 4. 

15. Suponga que Ax = Ax con x # 0. Sean a un escalar distinto 
de los valores propios de A, y B = (A — a/) -1 . Reste ax en 
ambos miembros de la ecuación Ax = Ax, y utilice álgebra para 
demostrar que 1 /(A — a) es un valor propio de B, con x como 
un vector propio correspondiente. 

16. Suponga que ¿í es un valor propio de B en el ejercicio 15, 
y que x es un vector propio correspondiente, de manera que 
(A — a/U'x = ¿ix. Utilice esta ecuación para encontrar un 
valor propio de A en términos de ¿i y a. [Nota: ¿i # 0 porque 
B es invertible]. 

17. [M] Utilice el método de potencias inverso para estimar el valor 
propio intermedio de la A del ejemplo 3, con una exactitud a 
cuatro lugares decimales. Haga xq = (1, 0. 0). 


18. [M] Sea A como en el ejercicio 9. Aplique el método de poten¬ 
cias inverso con xo = (1, 0, 0) para estimar el valor propio de A 
cercano a a = —1.4, con una exactitud a cuatro decimales. 


[M] En los ejercicios 19 y 20, determine: a) el valor propio más 
grande y b) el valor propio más cercano a cero. En cada caso, xo = 
(1, 0, 0, 0) y realice las aproximaciones hasta que la secuencia de 
acercamiento parezca exacta con cuatro decimales. Incluya el vector 
propio aproximado. 


19. A = 


20. A = 


'10 7 

7 5 

8 6 

7 5 

1 2 

2 12 
-2 3 

4 5 


8 7 

6 5 

10 9 

9 10 

3 2' 

13 11 

0 2 

7 2 


21. Un error común es que si A tiene un valor propio estrictamente 
dominante, entonces, para cualquier k suficientemente grande, 
el vector A k x es aproximadamente igual a un vector propio de 
A. Para las tres matrices que se muestran a continuación, estudie 
qué sucede a A a x cuando x = (.5, .5), e intente obtener conclu¬ 
siones generales (para una matriz de 2 x 2). 


a) A = 

c) A— 


.8 0 
0 .2 

8 0 ' 

0 2 


b) A = 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 

Para A y x dados, 



'5 8 4" 

1 .00' 


3.00" 

Ax = 

8 3-1 

-4.30 

= 

-13.00 


4^ 

N> 

8.10 


24.50 


Si Ax es cercanamente un múltiplo de x, entonces las razones de las entradas correspondientes 
en los dos vectores deberían ser casi constantes. Entonces, calcule: 


{entrada en Ax ¡ 4- {entrada en x} = {razón} 

3.00 1.00 3.000 

-13.00 -4.30 3.023 

24.50 8.10 3.025 


Cada entrada en Ax es alrededor de tres veces la entrada correspondiente en x, de manera que 

- x es cercano a un vector propio de A. Cualesquiera de las razones anteriores es una estimación 

WEB del valor propio. (Con cinco decimales, el valor propio es 3.02409). 
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CAPÍTULO 5 EJERCICIOS COMPLEMENTARIOS 


En estos ejercicios suplementarios. Ay B representan matrices cua¬ 
dradas de tamaño adecuado. 

1. Marque cada enunciado como verdadero o falso. Justifique cada 

respuesta. 

á) Si A es invertible y 1 es uno de sus valores propios, entonces 
1 también es valor propio de A~*. 

b) Si A es equivalente por filas a la matriz identidad /, enton¬ 
ces A es diagonalizable. 

c) Si A contiene una fila o una columna de ceros, entonces 0 
es un valor propio de A. 

d) Cada valor propio de A también lo es de A 2 . 

e) Cada vector propio de A también lo es de A 2 . 

/) Cada vector propio de una matriz invertible A también lo 
es de A -1 . 

g) Los valores propios deben ser escalares diferentes de cero. 

h) Los vectores propios deben ser vectores distintos de cero. 

i) Dos vectores propios correspondientes al mismo valor pro¬ 
pio siempre son linealmente dependientes. 

j) Las matrices similares siempre tienen exactamente los mis¬ 
mos valores propios. 

k) Las matrices similares siempre tienen exactamente los 
mismos vectores propios. 

l) La suma de dos vectores propios de una matriz A también 
es vector propio de esta. 

m) Los valores propios de una matriz triangular A superior son 
exactamente las entradas distintas de cero sobre la diagonal 
de A. 

n) Las matrices Ay A T tienen los mismos valores propios, con¬ 
tando sus multiplicidades. 

o) Si una matriz A de 5 x 5 tiene menos de 5 valores pro¬ 
pios distintos, entonces A no es diagonalizable. 

p) Existe una matriz de 2 x 2 que no tiene vectores propios 
en IR 2 . 

q) Si A es diagonalizable, entonces las columnas de A son li¬ 
nealmente independientes. 

r) Un vector distinto de cero no puede corresponder a dos va¬ 
lores propios diferentes de A. 

s) Una matriz (cuadrada) A es invertible si y solo si existe un 
sistema de coordenadas donde la transformación x i—> Ax 
esté representada por una matriz diagonal. 

t) Si cada vector e ; en la base estándar para IR" es un vector 
propio de A, entonces A es una matriz diagonal. 

u) Si A es similar a una matriz diagonalizable B, entonces A 
también es diagonalizable. 

i') Si A y 6 son matrices de n x n invertibles, entonces AB es 
similar a BA. 

w) Una matriz de n x n con n vectores propios linealmente in¬ 
dependientes es invertible. 


2 . 


3. 


4. 


5. 


6 . 


7. 


8 . 


9. 


10 . 


11 . 


x ) Si A es una matriz de n x n diagonalizable, entonces cada 
vector en IR" se escribe como una combinación lineal de vec¬ 
tores propios de A. 

Demuestre que si x es un vector propio de la matriz producto AB 
y Bx ± 0. entonces Bx es un vector propio de BA. 

Suponga que x es un vector propio de A correspondiente a 
un valor propio A. 

a) Pruebe que x es un vector propio de 51 — A. ¿Cuál es el valor 
propio asociado? 

b) Demuestre que x es un vector propio de 5/ — 3A + A 2 . ¿Cuál 
es el valor propio asociado? 

Utilice inducción matemática para demostrar que si A es un 
valor propio de una matriz A den x n, con x como un vector 
propio correspondiente, entonces, para cada entero positivo m, 
A m es un valor propio de A'" con x como un vector propio co¬ 
rrespondiente. 

Si p(t) = Co + Cií + Cit 1 + • • • + c„t", defina p(A) como la 
matriz formada al remplazar cada potencia de t en p(t) por 
la potencia correspondiente de A (con A° = /). Es decir, 

p(A) = cq! 4- c¡A + C 2 A“ + • • • + c„A" 


Demuestre que si A es un valor propio de A, entonces un valor 
propio de p(A) es p( A). 

Suponga que A = PDP' 1 , donde P es 2 x2y D = 

a) Sea B = 51 — 3A + A 2 . Demuestre que B es diagonalizable 
encontrando una factorización conveniente de B. 

b) Dados p(t) y p(A) como en el ejercicio 5, demuestre que 
p(A) es diagonalizable. 

Suponga que A es diagonalizable y que p(t) es el polinomio 
característico de A. Defina p(A) como en el ejercicio 5, y prue¬ 
be que p(A) es la matriz cero. Este hecho, el cual es válido para 
cualquier matriz cuadrada, se conoce como teorema de Cayley- 
Hamilton. 


2 0 
0 7 


a) Sea A una matriz de n x n diagonalizable. Demuestre que si 
la multiplicidad de un valor propio A es n, entonces A = AI. 


b) Utilice el inciso a) para demostrar que la matriz 



no es diagonalizable. 


Demuestre que I — A es invertible cuando todos los valores 
propios de A son menores que 1 en magnitud. [Sugerencia: 
¿Qué sería cierto si / — A no fuera invertible?] 

Demuestre que si A es diagonalizable, con todos los valores pro¬ 
pios menores que 1 en magnitud, entonces A* tiende a la matriz 
cero conforme k —> [Sugerencia: Considere A k x donde x re¬ 
presenta cualquiera de las columnas de /]. 

Sean u un vector propio de A correspondiente a un valor pro¬ 
pio A, y H la recta en IR" que pasa por u y por el origen. 
a) Explique por qué H es invariante bajo A en el sentido de que 
Ax está en H siempre que x esté en H. 
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fe) Sea K el subespacio unidimensional de ¡R" que es invariante 
bajo A. Explique por qué K contiene un vector propio de A. 


12. Sea G = 


A 

0 


X 

B 


Utilice la fórmula (1) para el determi¬ 


nante dado en la sección 5.2 para explicar por qué det G = 
(det A)(det B). De esto, deduzca que el polinomio característico 
de G es el producto de los polinomios característicos de Ay B. 


Utilice el ejercicio 12 para encontrar los valores propios de las matri¬ 
ces en los ejercicios 13 y 14. 


3 

-2 

8 " 


0 

5 

-2 


0 

-4 

3 _ 


1 

5 

-6 

-7 

2 

4 

5 

2 

0 

0 

-7 

-4 

0 

0 

3 

1 


15. Sea J la matriz de n x n con todas las entradas igual a 1, y con¬ 
sidere A = (a — fe) / + fe./; es decir. 


~ a b fe 

fe a fe 

fe fe a 

fe fe fe 


fe" 

fe 

fe 


a 


Con los resultados del ejercicio 16 de los ejercicios comple¬ 
mentarios del capítulo 3 demuestre que los valores propios de 
A son a — fe y a + (n — 1 )fe. ¿Cuáles son las multiplicidades 
de esos valores propios? 


16. Aplique el resultado del ejercicio 15 para obtener los valores 


propios de las matrices 


y 


7 

3 

3 

3 

3 


3 

7 

3 

3 

3 


3 3 
3 3 
7 3 
3 7 
3 3 



2 

2 

1 


17. 


Sea A = 


«íi 

«21 


a 12 
a 22 


. Recuerde del ejercicio 25 de la sec¬ 


ción 5.4 que tr A (la traza de A) es la suma de las entradas diago¬ 
nales en A. Demuestre que el polinomio característico de A es 

A 2 — (tr A)A + det A 


Entonces, demuestre que los valores propios de una matriz A 


de 2 x 2 son reales si y solo si det A < [ - 


(¥)*■ 


18. Sea A = 


.4 -.3 

.4 1.2 


-.5 —.75 

1.0 1.50 


. Explique por qué A* se aproxima a 
cuando k —» °o. 


Los ejercicios 19 a 23 conciernen al polinomio 
p(t) = «o + ci\t + • • • + 1 + t n 


y a una matriz C p de n x n llamada matriz compañera de p: 


' 0 1 0 

0 0 1 


C P 


0 0 0 
— a 0 —a i — a 2 


0 

0 


1 

— 1 _ 


19. Escriba la matriz compañera C p para p(t) = 6 — 5/ + t 2 y, luego, 
determine el polinomio característico de C p . 

20. Sea p(t) = (t - 2){t - 3)(f - 4) = -24 + 26 1 - 9 1 2 + í 3 . 
Escriba la matriz compañera para p(t), y utilice las técnicas del 
capítulo 3 para obtener su polinomio característico. 


21. Utilice inducción matemática y pruebe que para n & 2, 


det(C,, — A/) — (—1)”(a 0 T ü\ A + • • • -{- a H —i A” 3 —1— A 71 ) 

= (-1)>(A) 

[Sugerencia: Desarrolle por cofactores sobre la primera colum¬ 
na. para demostrar que det (C p - A/) tiene la forma (—A )B + 
(— l)"ao, donde B es cierto polinomio (por la suposición de in¬ 
ducción)]. 

22. Sean p(t) = a 0 + a\t -f a 2 í 2 + f 3 , y A un cero dep. 
a) Escriba la matriz compañera para p. 

tí) Explique por qué A 3 = —a 0 — fliA — a^k 2 , y demuestre que 
(1, A, A 2 ) es un vector propio de la matriz compañera de p. 


23. Sea p el polinomio del ejercicio 22, y suponga que la ecuación 
p(t) = 0 tiene las raíces distintas Ai, A 2 , A 3 . Sea Ula matriz de 
Vandermonde 


V = 


1 

Ai 


1 1 

A2 A3 


A 2 A 2 A 2 


(La transpuesta de V se consideró en el ejercicio comple¬ 
mentario 11 del capítulo 2). Utilice el ejercicio 22 y un teo¬ 
rema de este capítulo para deducir que V es invertible (pero 
no calcule V -1 ). Después, explique por qué V~ l C p V es una 
matriz diagonal. 


24. [M] El comando roots (p) de MATLAB calcula las raíces de 
la ecuación polinomial p(t) = 0. Lea un manual de MATLAB y, 
luego, describa la idea básica que sustenta el algoritmo para el 
comando roots. 


25. [M] Aplique un programa matricial para diagonalizar 



0 

-1 

1 


si es posible. Utilice el comando de valores propios para cons¬ 
truir la matriz diagonal D. Si el programa tiene un comando 
que genere vectores propios, úselo para crear una matriz inverti¬ 
ble P. Después, determine AP — PD y PDP 1 . Analice sus 
resultados. 


26. [M] Repita el ejercicio 25 para A 


-8 


-5 

10 

3 


5 

2 

-8 

-2 


-2 

1 

6 

1 


0 

-2 

-3 

0 





Ortogonalidad y mínimos 
cuadrados 


EJEMPLO INTRODUCTORIO 

Base de datos geográficos de 
Norteamérica y sistema 
de navegación GPS 

Imagine que inicia un enorme proyecto que, según las esti¬ 
maciones, durará 10 años y requiere los esfuerzos de muchas 
personas para construir y resolver un sistema de 1,800,000 por 
900,000 ecuaciones lineales. Esto es exactamente lo que se 
hizo en 1974 con la encuesta geodésica nacional de Estados 
Unidos, cuando se actualizó el North American Datum (NAD), 
una red de 268,000 puntos de referencia localizados de manera 
precisa que generan el territorio completo de América del 
Norte, junto con Groenlandia, Hawai, las Islas Vírgenes, 

Puerto Rico y otras islas del Caribe. 


ecuaciones normales, lo que implicó 928,735 ecuaciones con 
928,735 variables. 1 

Más recientemente, el conocimiento de puntos de referen¬ 
cia en el suelo se ha vuelto crucial para determinar la ubica¬ 
ción exacta de satélites con el Sistema de posicionamiento glo¬ 
bal (Global Positioning System , GPS). Un satélite GPS calcula 
su posición en relación con la Tierra midiendo el tiempo que 
tardan las señales en llegar desde tres transmisores terrestres. 
Para hacer esto, los satélites utilizan relojes atómicos precisos 
que se han sincronizado con estaciones terrestres (cuyas ubi¬ 
caciones se conocen con exactitud gracias al NAD). 



Las latitudes y longitudes registradas en el NAD se 
deben determinar con una precisión dentro del rango de unos 
cuantos centímetros, ya que constituyen la base de encuestas, 
mapas, límites legales de propiedad y planos de proyectos 
de ingeniería civil, como los de carreteras e instalaciones de 
servicios públicos. Sin embargo, se tuvieron que agregar más 
de 200,000 nuevos puntos a los ya existentes desde la última 
actualización en 1927, y se acumularon errores con el 
paso de los años debido a mediciones imprecisas y a 
corrimientos de la corteza terrestre. En 1983 concluyó 
la recolección de datos para el reajuste del NAD. 

El sistema de ecuaciones del NAD no tenía solución de la 
manera habitual, pero sí una solución de mínimos cuadrados, 
que asignó latitudes y longitudes a los puntos de referencia 
en la forma que mejor correspondía a las 1.8 millones de 
observaciones. En 1986 se encontró la solución de mínimos 
cuadrados al resolver un sistema relacionado de las llamadas 


El Sistema de posicionamiento global se utiliza para 
determinar las ubicaciones de los nuevos puntos de referencia 
terrestres y también para encontrar la ubicación del usuario 
sobre el suelo tomando como base los mapas ya existentes. 
Cuando el conductor de un automóvil (o un alpinista) 
enciende un receptor GPS, este último mide los tiempos de 
llegada de señales provenientes de al menos tres satélites. 

Esta información, junto con los datos transmitidos sobre 
las ubicaciones de los satélites y los tiempos del mensaje, 
se utiliza para ajustar el tiempo del receptor GPS y así 
determinar su ubicación aproximada sobre la Tierra. Con la 
información proveniente de un cuarto satélite, el receptor 
GPS puede incluso establecer su altura aproximada. 


1 Se presenta un análisis matemático de la estrategia de solución (junto 
con detalles de todo el proyecto NAD) en North American Datum of 1983, 
Charles R. Schwarz (ed.), National Geodetic Survey, National Oceanic and 
Atmospheric Administration (NOAA) Professional Paper NOS 2, 1989. 
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Los problemas del NAD y el GPS se resuelven 
encontrando un vector que “satisface aproximadamente” 
un sistema de ecuaciones inconsistente. Una cuidadosa 


explicación de esta aparente contradicción requerirá de 
las ideas desarrolladas en las primeras cinco secciones 
de este capítulo. 


WEB 


Para obtener una solución aproximada de un sistema de ecuaciones inconsistente que carece 
de solución, se necesita una idea bien definida de cercanía. La sección 6.1 introduce los con¬ 
ceptos de distancia y ortogonalidad en un espacio vectorial. Las secciones 6.2 y 6.3 muestran 
cómo se puede emplear la ortogonalidad para identificar aquel punto dentro de un subespacio 
W que es el más cercano al punto y externo a W. Considerando a W como el espacio colum¬ 
na de una matriz, la sección 6.5 desarrolla un método para obtener soluciones aproximadas 
(“mínimos cuadrados”) de sistemas lineales inconsistentes, tal como el sistema resuelto para 
el informe NAD. 

La sección 6.4 brinda otra oportunidad para ver proyecciones ortogonales en acción, 
creando una factorización matricial ampliamente utilizada en álgebra lineal numérica. Las sec¬ 
ciones restantes examinan algunos de los muchos problemas de mínimos cuadrados que sur¬ 
gen en las aplicaciones, incluyendo aquellas en espacios más generales que R". 


6.1 


PRODUCTO INTERIOR, LONGITUD Y ORTOGONALIDAD 


Aquí se definen para R" los conceptos geométricos de longitud, distancia y perpendiculari¬ 
dad, que son bien conocidos para R 2 y R 3 . Esos conceptos ofrecen poderosas herramientas 
geométricas para resolver muchos problemas aplicados, incluyendo los problemas ya men¬ 
cionados de mínimos cuadrados. Los tres conceptos se definen en términos del producto 
interior de dos vectores. 

Producto interior 

Si u y v son vectores en R", entonces u y v se consideran matrices den x 1 . La transpuesta u 7 
es una matriz de 1 x n, y el producto matricial u , v es una matriz de 1 x 1 , que se representa 
como un solo número real (un escalar) sin corchetes. El número ii 7 v se llama el producto 
interior de u y v, y con frecuencia se representa como u • v. Este producto interior, que se 
mencionó en los ejercicios de la sección 2.1, también se llama producto punto. Si 



U\ 


G 

u = 

u 2 

y V = 

V 2 


Un 


V„ 


entonces, el producto interior de u y v es 


[u x u 2 ■■ 

'■ ««] 

1 

<N 

1 _ 

= U\V\ + u 2 V2 + " 

u n v n 



L v « J 
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TEOREMA 1 


DEFINICIÓN 


(a, b) 

A la 2 + b 2 
\b\ 

- Vi- x , 

lal 0 1 

FIGURA 1 

Interpretación de ||v|| como 
longitud. 


EJEMPLO 1 Calcule u v y vu para u = 

2 

-5 

y V = 

3" 

2 


-1 


-3 


SOLUCIÓN 


u*v = u r v 


v*u = v r u 


[2 -5 -1] 

[3 2 -3] 



= (2) (3) + (—5)(2) + (— 1) (—3) = —1 

= (3) (2) + (2) (—5) + (—3)(—1) = —1 ■ 


A partir de los cálculos en el ejemplo 1 resulta claro por qué u-v = v-u. La conmuta- 
tividad del producto interior es válida en general. Las siguientes propiedades del producto 
interior se deducen fácilmente de las características de la operación de transponer estudiada 
en la sección 2.1. (Véase los ejercicios 21 y 22 al final de esta sección). 


Sean u, v y w vectores en R", y c un escalar. Entonces, 

a) u v = vu 

b) (u + v)-w = u-w + v-w 

c) (cu)-v = c(u-v) = u-(cv) 

d) u-u >0, y u-u = 0 si y solo si u = 0 


Las propiedades b) y c) se pueden combinar varias veces para obtener la siguiente regla 
útil: 


(ciU! + ••• + c p u p )-w = cdurw) + ••• + Cp(iyw) 


Longitud de un vector 

Si v está en R", con entradas tq,. v,„ entonces la raíz cuadrada de vv está definida, ya que 
v-v es no negativo. 


La longitud (o norma) de v es el escalar no negativo ||v|| definido por 



Suponga que v está en R 2 , es decir, v = 


a 

b 


. Como es usual, si se identifica a v con un 


punto geométrico en el plano, entonces ||v|| coincide con el concepto estándar de la longitud 
del segmento de recta que va del origen a v. Esto se deduce a partir del teorema de Pitágoras 
aplicado a un triángulo como el de la figura 1. 

Un cálculo similar con la diagonal de una caja rectangular demuestra que la definición de 
longitud de un vector v en R 3 coincide con el concepto habitual de longitud. 

Para cualquier escalar c, la longitud de cv es Id veces la longitud de v. Es decir. 


(Para ver esto, calcule ||cv 



(cv)* (cv) = c 2 v*v = c 2 ||v|| 2 y obtenga raíces cuadradas). 
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Un vector unitario es un vector cuya longitud es 1. Si un vector v distinto de cero se 
divide entre su longitud —es decir, se multiplica por l/||v|| —, se obtiene un vector unitario u 
ya que la longitud de u es (l/||v||)||v||. El proceso de crear u a partir de v en ocasiones se 
llama normalización de v, y se dice que u está en la misma dirección que v. 

Los ejemplos que se presentan a continuación emplean notación de vectores (columnas), 
para ahorrar espacio. 


EJEMPLO 2 Sea v = (1, — 2, 2, 0). Encuentre un vector unitario u en la misma direc¬ 
ción que v. 

SOLUCION Primero, calcule la longitud de v: 

||v|| 2 = vv = (l) 2 + (—2) 2 + (2) 2 + (O) 2 = 9 
||v|| = V9=3 

Después, multiplique v por l/||v|| para obtener 


1 + 


w 


H-b 


a) 


1 


1/3" 

-2 


-2/3 

2 


2/3 

0 


0 


Para comprobar que ||u|| = 1 es suficiente probar que ||u|| 2 = 1. 

Il u l| 2 = u *u = (|) 2 + ( — f) 2 + (|) 2 + (O) 2 

= 5+5+5+0 = l * 

EJEMPLO 3 Sea W el subespacio de IR 2 generado por x = (|, 1). Obtenga un vector 
unitario z que sea una base para W. 



SOLUCIÓN W consiste en todos los múltiplos de x, como el de la figura 2a). Cualquier vec¬ 
tor distinto de cero en W es una base para W. Para simplificar los cálculos, “escale” x para 
eliminar fracciones. Es decir, multiplique x por 3 para obtener 



Ahora calcule ||y|| 2 = 2 2 + 3 2 = 13, ||y|| = Vl3, y normalice y para obtener 



b) 

1 

'2' 


"2/VI3 " 

FIGURA 2 


Z ~ VI3 

3 


_3/x/l3_ 


Normalización de un vector para _ _ 

obtener un vector unitario. Véase la figura 2b). Otro vector unitario es (—2/\/l3, —3/Vl3). ■ 


Distancia en U n 

Ahora ya estamos listos para describir qué tan cerca está un vector de otro. Recuerde que si a 
y b son números reales, la distancia sobre la recta numérica entre a y b es el número \a — b\. 
En la figura 3 se ilustran dos ejemplos. Esta definición de distancia en IR tiene una analogía 
directa en R". 


a b 

H-1-1-1-1-1-1-1-b 

123456789 
6 unidades de separación 


a b 


-3 -2 -1 0 1 2 3 4 5 

. 7 unidades de separación . 


12-81 = 1-61 = 6 o 18-21 = 161 = 6 


l(-3) - 41 = 1-71 = 7 o 14-(-3)1 = 171 = 7 


FIGURA 3 Distancias en IR. 
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DEFINICIÓN 


Para u y v en IR", la distancia entre u y v, que se escribe como dist(u, v), es la longitud 
del vector u — v. Es decir, 

dist(u, v) = ||u — v|| 


En R 2 y R 3 , esta definición de distancia coincide con las fórmulas usuales de la distancia 
euclidiana entre dos puntos, como muestran los siguientes dos ejemplos. 

EJEMPLO 4 Determine la distancia entre los vectores u = (7, 1) y v = (3, 2). 
SOLUCIÓN Calcule 


'7' 


'3' 


r 4i 

1 


2 


1 

7 


u — v|| = + (—l) 2 = \/Í7 


La figura 4 muestra los vectores u, v y u — v. Cuando el vector u — v se suma a v, el 
resultado es u. Observe que en la figura 4 el paralelogramo revela que la distancia de u a v 
es igual a la distancia de u — v a 0. ■ 



FIGURA 4 La distancia entre u y v es la 
longitud de u — v. 


EJEMPLOS Siu = ( Hl , ui, M3) y v = (iq, V 2 , Vi), entonces 

dist(u, v) = ||u —v|| = \J (u — v) • (u — v) 

= V(«i - vi) 2 + (n 2 - vi) 2 + (ir3 - i> 3 ) 2 



FIGURA 5 


Vectores ortogonales 

El resto de este capítulo depende del hecho de que el concepto de rectas perpendiculares de 
geometría euclidiana tiene un análogo en R". 

Considere R 2 o R 3 y dos rectas que pasan por el origen determinado por los vectores 
u y v. Las dos rectas que se muestran en la figura 5 son geométricamente perpendiculares si 
y solo si la distancia de u a v es la misma que la distancia de u a — v. Esto es lo mismo que 
requerir que los cuadrados de las distancias sean iguales. Ahora 

[ dist(u, -v) ] 2 = ||u - (—v)|| 2 = ||u + v|| 2 
= (u +v)- (u + v) 

= u- (u + v) + v- (u + v) Teorema l(b) 

= U-U + U-V + V-U + V-V Teorema l(a), (b) 

= ||u|| 2 + ||v|| 2 + 2u*V Teorema l(a) (1) 
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Los mismos cálculos con v y -v intercambiados indican que 

[dist(u, v)] 2 = ||u|| 2 + || - v|| 2 + 2u- (-v) 

= ||u|| 2 + IIv|| 2 - 2u-v 

Las dos distancias al cuadrado son iguales si y solo si 2u-v = — 2u-v, lo que ocurre si y 
solo si u-v = 0. 

Este cálculo demuestra que cuando los vectores u y v se identifican con puntos geométri¬ 
cos, las rectas correspondientes que pasan por los puntos y por el origen son perpendiculares 
si y solo si u-v = 0. La siguiente definición generaliza a R" este concepto de perpendiculari¬ 
dad (u ortogonalidad, como se le llama con frecuencia en álgebra lineal). 


DEFINICIÓN 


Dos vectores u y v en R" son ortogonales (entre sí) si u-v = 0. 


Observe que el vector cero es ortogonal a todo vector en R" porque 0 r v = 0 para 
toda v. 

El siguiente teorema expone un dato útil en relación con los vectores ortogonales. 
La demostración se deduce inmediatamente de los cálculos en la ecuación (1) y de la defi¬ 
nición de ortogonalidad. El triángulo rectángulo que se ilustra en la figura 6 permite visua¬ 
lizar las longitudes que aparecen en el teorema. 


TEOREMA 2 



FIGURA 6 


Teorema de Pitágoras 

Dos vectores u y v son ortogonales si y solo si ||u + v|| 2 = ||u|| 2 + ||v|| 2 . 


Complementos ortogonales 

Para practicar el uso de productos interiores, aquí se introduce un concepto que será útil en 
la sección 6.3 y en todo el capítulo. Si un vector z es ortogonal a todo vector en un subes¬ 
pacio W de R", entonces se dice que z es ortogonal a W. El conjunto de todos los vectores z 
que son ortogonales a VE se llama complemento ortogonal de VE y se denota con W 1 (que 
se lee “perpendicular a W”). 


w 



W 

FIGURA 7 

Un plano y una recta que pasan 
por 0 como complementos 
ortogonales. 


EJEMPLO 6 Sean W un plano a través del origen en R 3 , y L la recta que pasa por el 
origen y es perpendicular a W. Si z y w son distintos de cero, z está sobre L y w está en W, 
entonces el segmento de recta de 0 a z es perpendicular al segmento de recta de 0 a w; es 
decir, z-w = 0. Véase la figura 7. De manera que todo vector sobre L es ortogonal a cada w en 
W. En efecto, L consiste en todos los vectores que son ortogonales a todos los vectores w 
en W, y W consiste en todos los vectores ortogonales a todos los vectores z en L. Es decir, 

L = W ± y W = L 1 - U 

Los siguientes dos hechos sobre W ± , con W como un subespacio de R", se necesi¬ 
tarán más adelante en este capítulo. Las demostraciones se sugieren en los ejercicios 29 y 30. 
Los ejercicios 27 a 31 ofrecen una excelente oportunidad de practicar con las propiedades del 
producto interior. 


1. Un vector x está en VL X si y solo si x es ortogonal a cada vector de cualquier con¬ 
junto que genera a W. 

2. W 1 - es un subespacio de R". 
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TEOREMA 3 


El siguiente teorema y el ejercicio 31 comprueban las afirmaciones hechas en la sec¬ 
ción 4.6 en relación con los subespacios que se muestran en la figura 8. (Véase también el 
ejercicio 28 de la sección 4.6). 




Ai 






d 


0 




^01 




FIGURA 8 Los subespacios fundamentales 
determinados por una matriz A de m x n. 


Sea A una matriz de m x n. El complemento ortogonal del espacio fila de A es el espa¬ 
cio nulo de A, y el complemento ortogonal del espacio columna de A es el espacio nulo 
de A T : 

(Fil A) 1 - = Nul A y (Col A) ^ = Nul A T 


DEMOSTRACIÓN La regla fila-columna para calcular Ax indica que si x está en Nul A , 
entonces x es ortogonal a cada fila de A (con las filas consideradas como vectores en R"). 
Como las filas de A generan el espacio fila, entonces x es ortogonal a Fil A. Y a la inversa, 
si x es ortogonal a Fil A, entonces x, evidentemente, es ortogonal a cada fila de A, y por lo 
tanto, Ax = 0. Esto demuestra el primer enunciado del teorema. Ya que este enunciado es 
verdadero para cualquier matriz, es válido para A T . Es decir, el complemento ortogonal del 
espacio fila de A r es el espacio nulo de A 1 . Esto demuestra la segunda afirmación porque 
Fil A t = Col A. ■ 

Ángulos en IR 2 y U 3 (opcional) 

Si u y v son vectores distintos de cero en R 2 o R 3 , entonces existe una agradable conexión 
entre su producto interior y el ángulo ñ entre los dos segmentos de recta que van del origen 
a los puntos identificados con u y v. La fórmula es 

u-v = |ju| ||v|| eos líf (2) 

Si se desea comprobar esta fórmula para vectores en R 2 , considere el triángulo que se 
ilustra en la figura 9, con lados de longitudes ||u||, ||v|| y ||u — v||. De acuerdo con la ley de 
los cosenos, 

||u — v|| 2 = ||u|| 2 + IMI 2 — 2||u|| || v|| eos # 


(u v u 2 ) 


Mu - vil 



"U" ^ 

b 

íívÑ 

=*• (v p v 2 ) 


FIGURA 9 El ángulo entre dos vectores. 
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que se puede reordenar para obtener 

||u|| ||v|| cosí} = ^ [||u|| 2 + ||v|| 2 - ||u — v|| 2 ] 

= \ [ M 1 + u 2 + V¡+vj- (wi - Ui) 2 - ( U 2 - V 2 f] 

= U \V\ + U 2 V 2 

= u-v 

La comprobación es similar para R :! . Cuando n > 3, la fórmula (2) se puede utilizar para 
definir el ángulo entre dos vectores en IR". En estadística, por ejemplo, el valor de eos ■& 
definido por la ecuación (2) para vectores convenientes u y v es lo que los especialistas en 
estadística llaman coeficiente de correlación. 


PROBLEMAS DE PRÁCTICA 


Sean a = 


'-2' 


'-3' 


"4/3" 


5" 

1 

, b = 

1 

, c = 

-1 

y d = 

6 



2/3 


-1 


1. Calcule-y I - a. 

a-a \a-a/ 

2. Encuentre un vector unitario u en la dirección de c. 

3. Demuestre que d es ortogonal a c. 

4. Utilice los resultados de los problemas de práctica 2 y 3 para explicar por qué d debe 
ser ortogonal al vector unitario u. 


6.1 EJERCICIOS 


En los ejercicios 1 a 8, determine las cantidades indicadas utilizando 
los vectores 



1 . 


u-u, v-u y 


2. w-w, x-w y 


3. 


1 

-w 


4. 


1 

-u 


14. Calcule la distancia entre u = 

0" 

-5 

y z = 

'-4" 
— 1 


2 


8 


En los ejercicios 15 a 18, determine qué pares de vectores son 
ortogonales. 







' 12 


2' 


8 


-2 





15. a = 

-5 

, b = 

-3 

16. u = 

3 

, v = 

-3 






—5 


3 


w*w 


u*u 

í—w 

6. 




Vx-xJ 

M 

8. 

||x| 


3' 


'-4' 


'-3' 


i" 

2 


1 

II 

X 

7 


-8 

5 

, y = 

-2 

4 

, Z = 

15 

0 


6 


0 


-7 


En los ejercicios 9 a 12, obtenga un vector unitario en la dirección 
del vector indicado. 


9. 

'-30' 
40 _ 

10. 

'-6~ 

4 

_ —3 _ 

11. 

"7/4" 

1/2 

1 

12. 

'8/3" 

2 


13. 


Encuentre la distancia entre x = 


10 

-3 


y y = 


-i 

-5 


En los ejercicios 19 y 20, todos los vectores están en IR". Marque 
cada enunciado como verdadero o falso. Justifique sus respuestas. 

19. a) v v = ||v|| 2 . 

b) Para cualquier escalar c, u-(cv) = c(u-v). 

c) Si la distancia de u a v es igual a la distancia de u a — v, 
entonces u y v son ortogonales. 

el) Para una matriz cuadrada A, los vectores en Col A son orto¬ 
gonales a los vectores en Nul A. 

e) Si los vectores vi,..., \ p generan un subespacio W y si x es 
ortogonal a cada v ¡ para j = 1 p, entonces x está en W ± . 
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20. a) u-v -v*u = 0. 

tí) Para cualquier escalar c, ||cv|| = c||v||. 

c) Si x es ortogonal a cada vector en un subespacio W, entonces 
x está en W T 

d) Si ||u|p + ||v|| 2 = ||u + v|| 2 , entonces u y v son ortogonales. 

e) Si A es una matriz de m x n, los vectores en el espacio nulo 
de A son ortogonales a los vectores en el espacio fila de A. 

21. Utilice la definición de transpuesta del producto interior para 
comprobar los incisos tí) y c) del teorema 1. Mencione los 
hechos pertinentes del capítulo 2. 


23. Sean u = 

2 “ 

-5 

y v = 

1 

1 1 

1 _ 


-1 


L 6 1 


22. Sea u = (u¡, «i, U}). Explique por qué u-u £ 0. ¿Cuándo 

u-u = 0 ? 


. Calcule y compare u-v, ||u|| 2 . 


||v || 2 y ||u + v|| 2 . No utilice el teorema de Pitágoras. 

24. Compruebe la ley del paralelogramo para vectores u y v en IR": 

||u + v || 2 + ||u - v || 2 = 2 ||u || 2 + 2 ||v || 2 

a x 

b . Describa el conjunto H de vectores ^ 

son ortogonales a v. [Sugerencia: Considere v = 0yv#fl]. 
5', 

y W el conjunto de todas las x en IR 3 tales 


25. Sea v = 


26. Sean u = 


que 


que u-x = 0. ¿Qué teorema del capítulo 4 se puede utilizar 
para demostrar que W es un subespacio de IR 3 ? Describa a W en 
lenguaje geométrico. 


27. Suponga que un vector y que es ortogonal a los vectores u y v. 
Demuestre que y es ortogonal al vector u + v. 

28. Suponga que y es ortogonal a u y v. Demuestre que y es orto¬ 
gonal a cada w en Gen ¡u, v}. [Sugerencia: Una w arbitraria en 
Gen {u, v) tiene la forma w = ciu + C 2 V. Demuestre que y es 
ortogonal a dicho vector w]. 


0-?- 


v 

vi 


ú efll 


29. Sea W = Gen {vi,..., v^}. Demuestre que si x es ortogonal 
a cada vpara 1 < y < p. entonces x es ortogonal a todo vector 
en W. 


30. Sean W un subespacio de IR", y W 1 - el conjunto de todos los 
vectores ortogonales a W. Demuestre que W 1 - es un subespacio 
de IR", considerando los siguientes pasos. 

a) Tome z en VT 3 -, y sea u cualquier elemento de W. Entonces 
z-u = 0. Tome cualquier escalar c y demuestre que cz es 
ortogonal a u. (Puesto que u era un elemento arbitrario de 
W, esto demostrará que cz está en W^). 

b) Tome zi y Z 2 en VT 3 -, y sea u cualquier elemento de W. 
Demuestre que z¡ + Z 2 es ortogonal a u. ¿Qué se puede 
concluir acerca de zi + Z 2 ? ¿Por qué? 

c) Termine la demostración de que W 1 - es un subespacio de 
IR”. 


31. Demuestre que si x está en W y W 3 -, entonces x = 0. 

32. [M] Construya un par u, v de vectores aleatorios en IR 4 , y sea 


A = 


.5 .5 .5 .5 

.5 .5 —.5 —.5 

.5 -.5 .5 —.5 

.5 -.5 -.5 .5 


a) Denote las columnas de A como ai,..., 84 . Obtenga la lon¬ 
gitud de cada columna, y calcule ara 2 , ara 3 , ai-a 4 , a 2 - a 3 , 
a 2 -a 4 y a 3 -a 4 . 

b) Calcule y compare las longitudes de u, Au, v y Ax. 

c) Utilice la ecuación (2) de esta sección para calcular el co¬ 
seno del ángulo entre u y v. Compare esto con el coseno del 
ángulo entre Au y Av. 

d) Repita los incisos tí) y c) para otros dos pares de vectores 
aleatorios. ¿Qué se puede suponer del efecto de A sobre los 
vectores? 


33. [M] Genere vectores aleatorios x, y y v en IR 4 con entradas en¬ 
teras (y v 4 0 ), y calcule las cantidades 


X-V\ /y-v\ (x + y)-v (10x)-v 

- v, - v,-v,-V 

y-x' \y-x' x-x x-x 


Repita los cálculos con nuevos vectores aleatorios x y y. 

/X-V\ 

¿Qué se puede suponer acerca del mapeo x ^ 7(x) = ^-jv 

(para v # 0)? Compruebe su suposición algebraicamente. 


34. 


-6 

3 

-27 

-33 

-13 

6 

-5 

25 

28 

14 

8 

-6 

34 

38 

18 

12 

-10 

50 

41 

23 

14 

-21 

49 

29 

33 


Construya 


una matriz N cuyas columnas formen una base para Nul A, y 
elabore una matriz R cuyas filas formen una base para Fil A 
(para detalles, véase la sección 4.6). Efectúe un cálculo matri- 
cial con N y R que muestre un hecho del teorema 3. 
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SOLUCIONES A LOS PROBLEMAS DE PRACTICA 

a-b 7 /a-b\ 7 

1. a b = 7, a-a = 5. Así,-= - y - a = -a = 

a-a 5 Va-a/ 5 


-14/5 

7/5 


2. Escale c, multiplicando por 3 para obtener y 


4 

-3 

2 


. Calcule ||y|| 2 = 29 y | 


1 


El vector unitario en la dirección de c y y es u = -—-y 

llyll 

3. d es ortogonal a c, porque 


4/V29 
-3/V29 
L 2/V29J 



5" 


“4/3“ 

d-c = 

6 

• 

-1 


-1 


2/3 


20 2 

— - 6 - - = 0 
3 3 


4. d es ortogonal a u porque u tiene la forma kc para alguna k, y 

d-u = d- (kc) = k( d-c) = k( 0) = 0 


6.2 CONJUNTOS ORTOGONALES 


V 29 . 


Se dice que un conjunto de vectores (ui,..., u,,¡ en IR" es un conjunto ortogonal si cada par 
de distintos vectores del conjunto es ortogonal, es decir, si u, u ; = 0 siempre que i A j. 



FIGURA 1 


EJEMPLO 1 Demuestre que ¡Ui, U 2 , U 3 } es un conjunto ortogonal, donde 

~ 3 1 r- 1 ! [- 1 / 2 “ 

U| = 1 , U2 = 2 , U3 = —2 

1 J |_ 1 J [7/2 

SOLUCION Considere los tres posibles pares de vectores distintos, a saber, {ui, U2}, {ui, 
u 3 } y ¡u 2 , u 3 }. 

ui-u 2 = 3(—1) + 1(2) + 1(1) = 0 
ui -u 3 = 3 (—j) + 1 (—2) + 1 ( 5 ) = 0 
U 2 -u 3 = —1 (—5) + 2 (—2) 4- 1 ( 5 ) = 0 

Cada par de vectores diferentes es ortogonal, y así {ui, U 2 , U 3 ¡ es un conjunto ortogonal. 
Véase la figura 1; ahí los tres segmentos de recta son mutuamente perpendiculares. ■ 


TEOREMA 4 Si S = {ui,..., u ; , } es un conjunto ortogonal de vectores distintos de cero en R", en¬ 
tonces S es linealmente independiente y, por lo tanto, es una base para el subespacio 
generado por S. 

DEMOSTRACION Si 0 = ciUi + ••• + c p u p para algunos escalares c 1 ,..., c p , entonces 

0 = 0-ui = (ciui + c 2 u 2 -I-1- CpUpj-ui 

= (ciUi)-m + (c 2 u 2 )-Ui 4-b (cpUp)-m 

= ci(ui-m) + c 2 (u 2 - ui) 4-b c p (u p - ui) 

= ci(ui-m) 


ya que Ui es ortogonal a U 2 ,..., u /; . Como Ui es diferente de cero, entonces urui no es cero 
y así Ci = 0. De manera similar, C2,..., c p deben ser cero. Por lo tanto, S es linealmente in¬ 
dependiente. ■ 
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DEFINICIÓN 


Una base ortogonal para un subespacio W de IR" es una base para W que también es 
un conjunto ortogonal. 


El siguiente teorema sugiere por qué una base ortogonal es mucho más agradable que 
otras bases. Los pesos en una combinación lineal se pueden calcular fácilmente. 


TEOREMA 5 


Sea ¡Ui,..., u ; , ¡ una base ortogonal para un subespacio W de R". Para cada y en W, los 
pesos en la combinación lineal 


están dados por 


y = ciu, + ••• + c p u p 


yu t 

Cj = - 

7 U/U, 


U = h...,p) 


DEMOSTRACIÓN Como en la demostración anterior, la ortogonalidad de {ui,..., u ; ,} 
demuestra que 


y-ui = (cim + c 2 u 2 H- 1 - CpVL p )-vn = ci(ui-ui) 


Puesto que upui no es cero, en la ecuación anterior se puede despejar C\. Para encontrar 
Cj, considerando j = 2calcule yu, y despeje cj. ■ 


EJEMPLO 2 El conjunto S = {ui, u 2 , U 3 } del ejemplo 1 es una base ortogonal para R 3 . 


Exprese el vector y = 



como una combinación lineal de los vectores en S. 


SOLUCIÓN Calcule 


y-ui = 11, 

Ui • Ui = 11, 


y-u 2 = - 12 , 
u 2 * u 2 = 6, 


y-u 3 = -33 
113 • u 3 = 33/2 


Por el teorema 5, 


yu, yu 2 yu 3 

y — -ui -\ -u 2 -\ -u 3 


Ui- Ui 
11 

= —U! + 

11 


u 2 - u 2 

12 


U3 • u 3 


-33 

-u 2 H-— u 3 

6 33/2 


= U| — 2u 2 — 2u 3 


Observe qué fácil es obtener los pesos necesarios para construir y a partir de una base 
ortogonal. Si la base no fuera ortogonal, se necesitaría resolver un sistema de ecuaciones 
lineales para encontrar los pesos, como en el capítulo 1. 

A continuación se presenta una construcción que será un paso clave en muchos cálculos 
que implican ortogonalidad, y que conducirá a una interpretación geométrica del teorema 5. 


Una proyección ortogonal 

Dado un vector u distinto de cero en R", considere el problema de descomponer un vector 
y en R" en la suma de dos vectores, siendo uno un múltiplo de u y el otro ortogonal a u. Se 
desea escribir 


y = y+ z 


(i) 





340 CAPÍTULO 6 Ortogonalidad y mínimos cuadrados 


z = y-y y 



FIGURA 2 

Determinación de a para hacer 
que y — y sea ortogonal a u. 


donde y = mi para algún escalar a, y z es algún vector ortogonal a u. Véase la figura 2. 
Dado cualquier escalar a, sea z = y — au, tal que la ecuación (1) se satisface. Entonces 
y — y es ortogonal a u si y solo si 

0 = (y — au)-u = y-u — (q'u)-u = y-u — a(u-u) 

y*u „ y-u 

Es decir, la ecuación (1) se satisface con z ortogonal a u si y solo si a = -y y = - u. 

u-u u-u 

El vector y es la proyección ortogonal de y sobre u, y el vector z es la componente de y 
ortogonal a u. 

Si c es cualquier escalar distinto de cero y si u se remplaza por cu en la definición 
de y, entonces la proyección ortogonal de y sobre cu coincide exactamente con la proyec¬ 
ción ortogonal de y sobre u (ejercicio 31). De ahí que esta proyección esté determinada 
por el subespacio L generado por u (la recta que pasa por u y 0). Algunas veces y se de¬ 
nota como proy¿ y, y se llama la proyección ortogonal de y sobre L. Es decir, 

„ yu 

y = prqj i y= -U (2) 

u-u 


EJEMPLO 3 Sean y = 


y u = 


. Encuentre la proyección ortogonal de y so¬ 


bre u. Después escriba y como la suma de dos vectores ortogonales, uno en Gen { u } y el otro 
ortogonal a u. 


SOLUCION Calcule 



= 40 

= 20 


La proyección ortogonal de y sobre u es 

8 
4 


yu 40 

-u = —u = 2 

u*u 20 


y la componente de y ortogonal a u es 


r?i 


00 


■-1 " 

i 

so 

_1 


1 

_1 


2 


La suma de esos dos vectores es y. Es decir, 



t t t 
y y (y - y) 


En la figura 3 se muestra esta descomposición de y. Nota: Si son correctos los cálculos an¬ 
teriores, entonces {y, y — y} será un conjunto ortogonal. Para comprobarlo, determine 


y-(y-y) 



Como el segmento de recta de la figura 3 entre y y yes perpendicular a L, por cons¬ 
trucción de y, entonces el punto identificado con y es el punto más cercano de L a y. (Esto 
se puede demostrar con geometría. Ahora se supondrá esto para IR 2 y en la sección 6.3 se 
demostrará para R"). 
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FIGURA 3 La proyección ortogonal de y sobre una 
recta L que pasa por el origen. 


EJEMPLO 4 En la figura 3 encuentre la distancia de y a L. 

SOLUCION La distancia de y a L es la longitud del segmento de recta perpendicular de y a 
la proyección ortogonal y. Esta longitud es igual a la longitud de y — y. Así, la distancia es 

lly - yll = V(-i ) 2 + 2 2 = Vs ■ 

Una interpretación geométrica del teorema 5 

En la ecuación (2), la fórmula para la proyección ortogonal y tiene la misma apariencia que 
cada uno de los términos en el teorema 5. Así, el teorema 5 descompone un vector y en una 
suma de proyecciones ortogonales sobre subespacios unidimensionales. 

Es fácil visualizar el caso en el cual W = R 2 = Gen {m, 112 }, con u¡ y 112 ortogonales. 
Cualquier y en R 2 se puede escribir en la forma 


y = 


yut 

UfUi 


Ui + 


yu 2 

-u 2 

u 2 * U 2 


(3) 


El primer término en (3) es la proyección de y sobre el subespacio generado por ui (la recta 
que pasa por Ui y por el origen), y el segundo término es la proyección de y sobre el subespa¬ 
cio generado por 112 . Así, la ecuación (3) expresa a y como la suma de sus proyecciones sobre 
los ejes (ortogonales) determinados por y 112 . Véase la figura 4. 


(y 2 = proyección sobre u,, 


>y 


yj = proyección sobre 11 


FIGURA 4 Un vector descompuesto en 
la suma de dos proyecciones. 


El teorema 5 descompone a cada y en Gen {ui,..., u ; , ¡ en la suma de p proyecciones 
sobre subespacios unidimensionales que son mutuamente ortogonales. 
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Descomposición de una fuerza en sus componentes 

La descomposición que se ilustra en la figura 4 se presenta en física cuando se aplica una 
fuerza a un objeto. La elección de un sistema de coordenadas adecuado permite que la fuerza 
se represente con un vector y en R 2 o R 3 . Con frecuencia el problema implica alguna direc¬ 
ción particular de interés, que queda representada por otro vector u. Por ejemplo, si el objeto se 
está moviendo en línea recta cuando se aplica la fuerza, entonces el vector u podría apuntar en 
la dirección de movimiento, como se muestra en la figura 5. Un paso clave en el problema 
es descomponer la fuerza en una componente en la dirección de u y en una componente orto¬ 
gonal a u. Los cálculos serían análogos a los realizados en el ejemplo 3 anterior. 



FIGURA 5 


Conjuntos ortonormales 

Un conjunto {ui,..., u ;) } es un conjunto ortonormal si es un conjunto ortogonal de vectores 
unitarios. Si W es el subespacio generado por tal conjunto, entonces {ui,..., u ; , } es una base 
ortonormal para W, porque el conjunto es linealmente independiente de manera automática, 
de acuerdo con al teorema 4. 

El ejemplo más sencillo de un conjunto ortonormal es la base estándar {ei,_, e„¡ 

para R". Cualquier subconjunto no vacío de {ei,_, e„¡ también es ortonormal. A continua¬ 

ción se presenta un ejemplo más complicado. 

EJEMPLO 5 Demuestre que {vi, v 2 , V 3 } es una base ortonormal de R 3 , donde 



3/VTT 


-1/V6 


-1/V66 

Vi = 

1/vTT 

, V 2 = 

2/V6 

, v 3 = 

-4/V66 


1/vTT 


1/>/6 


7/V66 


SOLUCIÓN Calcule 



v r v 2 = -3/V66 + 2/V66+ 1/Vó6 = 0 
v r v 3 = -3/V726-4/V726+ 7/V726 = 0 
v 2 -v 3 = 1/V396- 8/V396 + 7/V396 = 0 

Así ¡vi, y 2 , V 3 } es un conjunto ortogonal. Además, 

v r vi = 9/11 + 1/11 + 1/11 = 1 
v 2 -v 2 = 1/6+ 4/6+ 1/6=1 
V 3 .V 3 = 1/66 + 16/66 + 49/66 = 1 


FIGURA 6 


que muestra que vi, v 2 y v 3 son vectores unitarios. Así, {Vi, v 2 , v? ¡ es un conjunto ortonormal. 
Como el conjunto es linealmente independiente, entonces sus tres vectores forman una base 
para R 3 . Véase la figura 6 . ■ 
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TEOREMA 6 


TEOREMA 7 


Cuando los vectores en un conjunto ortogonal de vectores distintos de cero se normalizan 
para que tengan longitud unitaria, entonces los nuevos vectores seguirán siendo ortogonales, 
por lo que el nuevo conjunto será un conjunto ortonormal. Véase el ejercicio 32. En la figura 
6 (ejemplo 5) es sencillo comprobar que los vectores son simplemente los vectores unitarios 
en las direcciones de los vectores de la figura 1 (ejemplo 1 ). 

Las matrices cuyas columnas forman un conjunto ortonormal son importantes en apli¬ 
caciones y en algoritmos computacionales para cálculos matriciales. Sus propiedades funda¬ 
mentales se exponen en los teoremas 6 y 7. 


Una matriz U de m x n tiene columnas ortonormales si y solo si U T U =/. 


DEMOSTRACIÓN Para simplificar la notación, suponga que U solo tiene tres columnas, 
cada una un vector en R m . En esencia, la demostración del caso general es la misma. Sea 
U = [ui U 2 U 3 ] y calcule 


U‘U = 


— 1 
c 

_1 



1 

c 

c 

u[u 2 

1 

s 

E-h- 

3 

T 

U 2 

[m 

U 2 U 3 ] = 

uf Ul 

T 

u[u 2 

u[u 3 

T 

l_ U 3 J 



|_UjUi 

U3 u 2 

uj U3J 


(4) 


Las entradas en la matriz de la derecha son productos interiores, empleando la notación trans¬ 
puesta. Las columnas de U son ortogonales si y solo si 


ufu2 = U2U1 = 0 , ufu3 = U^UI = 0 , UjU3 = llfll2 = 0 

Todas las columnas de U tienen longitud unitaria si y solo si 

ufui = 1, ujll 2 = L U3U3 = 1 
El teorema se deduce inmediatamente de las ecuaciones (4) a ( 6 ). 


(5) 


(6) 


Sea U una matriz de m x n con columnas ortonormales, y x y y están en R". 
Entonces, 

a) ||t/x|| = ||x|| 

b) (Ux)-(Uy) = xy 

c) (Ux)-(Uy) = 0 si y solo si x-y = 0 


Las propiedades a) y c) dicen que el mapeo lineal x >-> Ux preserva longitudes y or- 
togonalidad. Esas propiedades son importantes para muchos algoritmos computacionales. 
Véase el ejercicio 25 para la demostración del teorema 7. 


EJEMPLO 6 Sean U = 

1/V2 

1/V2 

2/3 

-2/3 

y x = 

" V 2 " 

3 

ñas ortonormales y 

0 

1/3 




. Observe que U tiene colum- 


U T U = 


1/V2 

2/3 


1/V2 

-2/3 


0 

1/3 


1/V2 

1/V2 

0 


2/3 

-2/3 

1/3 


1 0 
0 1 


Compruebe que ||t/x|| = ||x| 
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SOLUCIÓN 



"1/V2 

2/3" 

’V2" 

'X 


3" 

Ux = 

1/V2 

-2/3 

= 

-1 


0 

1/3 _ 



1 


|| C/x|| = V9 + 1 + 1 = Vñ 


||x|| = V2 + 9 = vTf a 

Los teoremas 6 y 7 son particularmente útiles cuando se aplican a matrices cuadradas. 
Una matriz ortogonal es una matriz cuadrada invertible U tal que U 1 = U T . De acuerdo 
con el teorema 6, tal matriz tiene columnas ortonormales. 1 Es fácil ver que cualquier ma¬ 
triz cuadrada con columnas ortonormales es una matriz ortogonal. De manera sorprendente, 
dicha matriz también debe tener fdas ortonormales. Véase los ejercicios 27 y 28. En el capí¬ 
tulo 7 se presentarán con frecuencia matrices ortogonales. 

EJEMPLO 7 La matriz 


U = 


3/vTT -1/Vó -1/V66 
1 /VTT 2/Vó -4/V66 
1 /VTT l/Vó 7/V66 


es una matriz ortogonal porque es cuadrada y porque sus columnas son ortonormales, de 
acuerdo con el ejemplo 5. Compruebe que las filas ¡también sean ortonormales! ■ 


PROBLEMAS DE PRACTICA 


'-1/V5" 


'2/vr 

2/V5_ 

y U 2 — 

. 1/V5. 


1 . Sean Ui = | ~ '/ J y u 2 = |- Demuestre que {ui, U 2 Í es una base ortonor- 

mal para R 2 . 

2. Sean y y L como en el ejemplo 3 y en la figura 3. Calcule la proyección ortogonal y 

' 2 ' 


de y sobre L utilizando u = 


1 


en lugar de u del ejemplo 3. 


3. Sean TJ y x como en el ejemplo 6, y y 


-3V2' 

6 


Compruebe que Ux-Uy = x-y. 


6.2 EJERCICIOS 


En los ejercicios 1 a 6, determine qué conjuntos de vectores son 
ortogonales. 



'- 1 " 


"5" 


3" 


1 " 


" 0 " 


"-5" 

1 . 

4 


2 


-4 

2 . 

-2 


1 


-2 


-3 


1 


-7 


1 


2 


1 



2 “ 


"- 6 " 


3" 


2 “ 


" 0 " 


4' 

3. 

-7 

, 

-3 


1 

4. 

-5 

, 

0 


-2 


-1 


9 


-1 


-3 


0 


6 


3" 


'-1 " 


"3 


5" 


" —4 _ 


3" 

-2 


3 


8 


-4 


1 


3 

1 

’ 

-3 

’ 

7 

O. 

0 


-3 


5 

3 


4 


0 


3 


8 


-1 


En los ejercicios 7 a 10. demuestre que jui, u 2 } o {ui, U 2 , U 3 } son 
una base ortogonal para IR 2 o IR 3 , respectivamente. Después exprese 
x como una combinación lineal de los vectores u. 



2 ' 


6 " 


9" 

Ul = 

-3 

, u 2 = 

4 

y x = 

-7 


1 Un mejor nombre sería matriz ortonormal , y este término se emplea en algunos textos de estadística. Sin embargo, 
matriz ortogonal es el término estándar en álgebra lineal. 
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'3' 


2" 


’-6" 

8. ui = 

1 

, u 2 = 

6 

y x = 

3 



' 1 " 


"-1 _ 


2“ 


8" 

9. Ul = 

0 

,U2 = 

4 

. u 3 = 

1 

y x = 

-4 


1 


1 


-2 


-3 



3" 


2“ 


' 1 " 


5" 

© 

C 

II 

-3 

, u 2 = 

2 

, u 3 = 

1 

y * = 

-3 


0 


-1 


4 


1 


11. Calcule la proyección ortogonal de 


sobre la recta que pasa 


por 


-4 

2 


y por el origen. 


12. Calcule la proyección ortogonal de 


1 

-1 


sobre la recta que 


pasa por 


13. Sean y = 


y por el origen. 


y u 


. Escriba y como la suma de dos 


vectores ortogonales, uno en Gen {u¡ y el otro ortogonal a u. 


14. Sean y = 


y « = 


. Escriba y como la suma de un 


vector en Gen {uj y un vector ortogonal a u. 


15. Sean y ; 


y u 


. Calcule la distancia de y a la recta 


que pasa por u y el origen. 


16. Sean y : 


-3 

9 


y u 


. Calcule la distancia de y a la 


recta que pasa por u y el origen. 

En los ejercicios 17 a 22, determine cuáles conjuntos de vectores son 
ortonormales. Si un conjunto solamente es ortogonal, normalice los 
vectores para obtener un conjunto ortonormal. 



"1/3" 


"-1/2" 


"0" 


0" 

17. 

1/3 

, 

0 

18. 

1 

, 

-1 


1/3 


!/2_ 


0 


0 


1 

Q “ 


'-2/3 


"1/3" 

- 

.0 

.6 

20. 

1/3 

2/3 

’ 

2/3 

0 



■ í/yir 

3/\/I6 - 

0 ■ 

21. 

3/V20 , 

-1/V20 , 

-1/V2 


_ 3/x/20_ 

_ —1/ V20 _ 

1/V2_ 



' 1/-/Í8" 


l/Vr 


'-2/3 

22. 

4/x/Í8 

, 

0 

, 

1/3 


. l/\/Í8_ 


.-1/V2. 


-2/3 


En los ejercicios 23 y 24, todos los vectores están en R". Marque 
cada enunciado como verdadero o falso. Justifique sus respuestas. 

23. a) No todo conjunto linealmente independiente en R" es un 
conjunto ortogonal. 


b) Si y es una combinación lineal de vectores distintos de cero 
de un conjunto ortogonal, entonces los pesos en la combi¬ 
nación lineal se pueden calcular sin operaciones de fila so¬ 
bre una matriz. 

c) Si se normalizan los vectores en un conjunto ortogonal de 
vectores distintos de cero, entonces tal vez algunos de los 
nuevos vectores no sean ortogonales. 

d) Una matriz con columnas ortonormales es una matriz 
ortogonal. 

e) Si L es una recta que pasa por 0 y si y es la proyección orto¬ 
gonal de y sobre L, entonces ||y|| da la distancia de y a L. 

24. a) No todo conjunto ortogonal en R" es linealmente indepen¬ 

diente. 

b) Si un conjunto S = {Ui,..., u p j tiene la propiedad de que 
Uf-Uy = 0 siempre que i + j, entonces S es un conjunto orto- 
normal. 

c) Si las columnas de una matriz A de m x n son ortonormales, 
entonces el mapeo lineal x Ax preserva longitudes. 

d) La proyección ortogonal de y sobre v es igual a la proyec¬ 
ción ortogonal de y sobre cv siempre que c # 0. 

e) Una matriz ortogonal es invertible. 

25. Demuestre el teorema 7. [Sugerencia: Para a), calcule ||[/x|p, 
o primero demuestre b)\. 

26. Suponga que W es un subespacio de R” generado por n vectores 
ortogonales distintos de cero. Explique por qué W = R". 

27. Sea U una matriz cuadrada con columnas ortonormales. Explique 
por qué U es invertible. (Mencione los teoremas que utilice). 

28. Sea V una matriz ortogonal denxn. Demuestre que las filas de 
U forman una base ortonormal de R". 

29. Sean U y V matrices ortogonales de n x n. Explique por qué 
UV es una matriz ortogonal. [Es decir, explique por qué UV 
es invertible y su inversa es (UV) 7 }. 

30. Sea U una matriz ortogonal; construya V intercambiando al¬ 
gunas de las columnas de U. Explique por qué V es una matriz 
ortogonal. 

31. Demuestre que la proyección ortogonal de un vector y sobre 
una recta L que pasa por el origen en R 2 no depende de la elec¬ 
ción del vector u diferente de cero en L que se emplea en la 
fórmula para y. Para hacer esto, suponga que y y u están da¬ 
dos y que y se calculó mediante la fórmula (2) de esta sección. 
Sustituya u en tal fórmula por cu, donde c es un escalar distin¬ 
to de cero no especificado. Demuestre que la nueva fórmula da 
el mismo valor para y. 

32. Sean [vi, V 2 } un conjunto ortogonal de vectores distintos de 
cero, y c\, c 2 escalares diferentes de cero. Demuestre que {ciVi, 
C 2 V 2 } también es un conjunto ortogonal. Como la ortogonalidad 
de un conjunto está definida en términos de pares de vectores, 
esto demuestra que si se normalizan los vectores en un conjunto 
ortogonal, el nuevo conjunto seguirá siendo ortogonal. 

33. Dado u # 0 en R", sea L = Gen ¡uj. Demuestre que el mapeo 
x i-» proy¿ x es una transformación lineal. 

34. Dado u # 0 en R", sea L = Gen {uj. Para y en R", la reflexión 
de y en L es el punto refl¿ y definido por 

refl¿ y = 2-proy L y - y. 
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Véase la figura, que indica que refl¿ y es la suma de y = proy¿ y 
y y — y. Demuestre que el mapeo y i-> refl¿ es una transfor¬ 
mación lineal. 



La reflexión de y en una recta que pasa por el origen. 

35. [M] Demuestre que las columnas de la matriz A son ortogonales 
haciendo el cálculo matricial adecuado. Especifique el cálculo 
que realizó. 



-6 

-3 

6 

1 

-1 

2 

1 

-6 

3 

6 

3 

-2 

6 

-3 

6 

-1 

2 

-1 

2 

3 

-3 

6 

3 

2 

-2 

-1 

2 

-3 

1 

2 

1 

6 


36. [M] En los incisos a) a d), sea U la matriz formada por la nor¬ 
malización de cada columna de la matriz A del ejercicio 35. 

a) Calcule U T U y UU T . ¿En qué difieren? 

b) Genere un vector aleatorio y en [R¡ 8 , y determine p = UU T y 
y z = y — p. Explique por qué p está en Col A. Compruebe 
que z sea ortogonal a p. 

c) Compruebe que z es ortogonal a cada columna de U. 

el) Observe que y = p + z, con p en Col A. Explique por qué 
z está en (Col A)+ (En la siguiente sección se explicará el 
significado de esta descomposición de y). 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Los vectores son ortogonales porque 

u r u 2 = -2/5 + 2/5 = 0 

Son unitarios porque 

|| Ul || 1 2 = (-1/V5) 2 + (2/V5) 2 = 1/5 + 4/5=1 
||u 2 || 2 = (2/V5) 2 + (1/V5) 2 = 4/5 +1/5=1 


En particular, el conjunto {ui, u 2 ¡ es linealmente independiente y, por lo tanto, es una 
base para US 2 porque hay dos vectores en el conjunto. 


2 . 


Cuando y = 


7 

6 


y u = 


2 

1 


y 


yu 

-u 

u-u 


' 2 ' 

_ A 

' 2 ' 


00 

1 

— 4 

1 


4 ^ 

1 _ 


Esta es la misma y que se encontró en el ejemplo 3. La proyección ortogonal no parece 
depender de la u seleccionada sobre la recta. Véase el ejercicio 31. 


3. Uy = 

"1/V2 

1/V2 

2/3" 

-2/3 

" —3a/2" 
6 


0 

1/3 _ 



1 

-7 

2 


También, del ejemplo 6, x = 




. Por lo tanto. 


Ux-Uy= 3 + 7 + 2= 12 y x-y = -6+18=12 
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6.3 PROYECCIONES ORTOGONALES 


La proyección ortogonal de un punto en IR 2 sobre una recta que pasa por el origen tiene una 
importante analogía en IR". Dado un vector y y un subespacio W en IR", existe un vector y 
en W tal que 1. y es el único vector en W para el cual y — y es ortogonal a W, y 2. y es el 
único vector en W más cercano a y. Véase la figura 1. Estas dos propiedades de y dan la 
clave para encontrar las soluciones de mínimos cuadrados de sistemas lineales, que se men¬ 
cionaron en el ejemplo introductorio de este capítulo. En la sección 6.5 se contará la his¬ 
toria completa. 

Como preparación para el primer teorema, observe que siempre que un vector y se re¬ 
presenta como una combinación lineal de vectores m,..., u„ en IR", los términos en la suma 
para y se pueden agrupar en dos partes de manera que y se representa como 

y = zi + z 2 

donde z¡ es una combinación lineal de algunas u„ y Z 2 es una combinación lineal de las u, 
restantes. Esta idea es útil en particular cuando {ui,..., u„} es una base ortogonal. De la 
sección 6.1 recuerde que W x denota el conjunto de todos los vectores ortogonales a un sub¬ 
espacio W. 



iv 

FIGURA 1 


EJEMPLO 1 Sea {ui,..., U 5 } una base ortogonal para IR 5 y 

y = C 1 U 1 + ••• + C 5 U 5 

Considere el subespacio W = Gen {ui, U2}, y escriba y como la suma de un vector zi en W 
y un vector Z 2 en W 1 . 

SOLUCIÓN Escriba 


y 


= C1U1 + C 2 U 2 + C3U3 + C4U4 + C5U5 


Z| 




donde zi = ciUi + C 2 U 2 está en Gen {ui, 112 } 

y Z2 = C3U3 + C4U4 + C5U5 está en Gen {113, U4, ug}. 

Para demostrar que Z 2 está en W ', es suficiente probar que Z 2 es ortogonal a los vectores en 
la base {ui, 112 } para W. (Véase la sección 6.1). Utilizando propiedades del producto interior, 
calcule 


Z2-U1 = (C3U3 + C4U4 + C 5 U 5 )-U1 

= C3U3 • Ui + C 4 U 4 - Ui + C 5 U 5 - U! 

= o 

ya que 11 1 es ortogonal a U3, U4 y U5. Un cálculo similar indica que z 2 U2 = 0. Así, Z2 está 
en W\ ■ 

El siguiente teorema demuestra que la descomposición y = Z! + Z 2 del ejemplo 1 se 
puede calcular sin tener una base ortogonal para IR". Es suficiente con tener una base orto¬ 
gonal solo para W. 
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TEOREMA 8 


Teorema de descomposición ortogonal 

Sea W un subespacio de IR". Entonces toda y en R" se puede escribir de forma única 
como 


y = y + z 


(i) 


donde y está en W y z está en W 1 . De hecho, si | u ¡..... u ; ,} es cualquier base ortogonal 
de W, entonces 


y * = y - y- 


y = 


y ui 
UfUl 


U1 + ••• + 


y up 

- u p 

UpUp 


( 2 ) 


El vector y en la ecuación (1) es la proyección ortogonal de y sobre W, y con frecuen¬ 
cia se escribe como proy ir y. Véase la figura 2. Cuando W es un subespacio unidimensional, 
la fórmula para y coincide con la fórmula que se presentó en la sección 6.2. 

z = y-y y 


JÜ 

y = proy^y 

FIGURA 2 Proyección ortogonal de y 
sobre W. 



DEMOSTRACION Sea {m,..., u^} una base ortogonal para W, y defina y con la ecua¬ 
ción (2). 1 Entonces y está en W porque y es una combinación lineal de la base Ui,..., u ;l . 
Sea z = y — y. Como ui es ortogonal a 112,..., u /; , entonces a partir de la ecuación (2) se 
deduce que 

z-ui = (y - y)-m = y-Uj - ( y Ul ) Ui • m - 0-0 

V ui • Ui J 

= y-u; -y-U! = 0 

Por lo tanto, z es ortogonal a ui. De manera similar, z es ortogonal a cada u, en la base para 
W. Por consiguiente, z es ortogonal para todo vector en W. Es decir, z está en W . 

Para demostrar que la descomposición en la ecuación (1) es única, suponga que y se 
puede escribir como y = y¡ + z¡ con yi en W, y Z| en W . Entonces y + z = y¡ + zi (ya que 
ambos lados son iguales a y), y así 


y — yi = zi — z 

Esta igualdad indica que el vector v = y — yi está en W y en W (porque z 1 y z están ambos 
en W L , y W es un subespacio). Por lo tanto, vv = 0, lo que demuestra que v = 0. Esto prue¬ 
ba que y = yi y también que z\ = z. ■ 

La unicidad de la descomposición (1) demuestra que la proyección ortogonal y solo 
depende de W y no de la base particular empleada en la ecuación (2). 


1 Se puede suponer que W no es el subespacio cero porque, de otra forma, W = IR" y la ecuación (1) simplemente 
sería y = 0 + y. En la siguiente sección se demostrará que cualquier subespacio distinto de cero de IR" tiene una 
base ortogonal. 
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EJEMPLO 2 Sean m = 

2 

5 

,u 2 = 

-2 

1 

y y = 

" 1 ' 

2 


-1 


1 


3 


. Observe que {ui, 112 } es 


una base ortogonal para W = Gen {ui, 112 }. Escriba y como la suma de un vector en W y 
de un vector ortogonal a W. 


SOLUCIÓN La proyección ortogonal de y sobre W es 


Ui-Ui U 2 -U 2 


9 

2“ 

3 

~-2" 

9 

2“ 

15 

~-2~ 


”-2/5" 


5 

+ — 

1 


5 

+ —— 

1 

— 

2 

30 

-1 

6 

1 

" 30 

-1 

30 

1 


1/5 _ 


Además, 


T 


”-2/5" 


" 7/5 ” 

2 

— 

2 

= 

0 

3 


!/ 5 _ 


14/5 


El teorema 8 asegura que y — y está en W . Sin embargo, para comprobar los cálculos, es 
una buena idea comprobar que y — y es ortogonal a Ui y 112 , y por lo tanto a toda W. 
La descomposición deseada de y es 


" 1 " 


"-2/5" 


" 7/5 " 

2 

= 

2 

+ 

0 

3 


!/5 _ 


14/5 


Interpretación geométrica de la proyección ortogonal 

Cuando W es un subespacio unidimensional, la fórmula (2) para proy»' y solo contiene un 
término. Así, cuando dim W > 1, cada término de la ecuación (2) es en sí mismo una pro¬ 
yección ortogonal de y sobre el subespacio unidimensional generado por uno de los vectores 
u en la base para W. La figura 3 muestra esto cuando W es un subespacio de R 3 generado 
por ui y 112 - Aquí, yi y £2 denotan las proyecciones de y sobre las rectas generadas por 
y U 2 , respectivamente. La proyección ortogonal y de y sobre W es la suma de las proyec¬ 
ciones de y sobre subespacios unidimensionales que son ortogonales entre sí. El vector y 
en la figura 3 corresponde al vector y de la figura 4 de la sección 6.2, porque ahora es y el 
que está en W. 



FIGURA 3 La proyección ortogonal de y es la suma de 
sus proyecciones sobre subespacios unidimensionales 
que son mutuamente ortogonales. 
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TEOREMA 9 


Propiedades de proyecciones ortogonales 

Si ¡Ui,..., u ; ,¡ es una base ortogonal para W y resulta que y está en W, entonces la fórmula 
para proy^ y es exactamente la misma que la representación de y en el teorema 5 de la sección 
6.2. En este caso, proy^ y = y. 


Si y está en W = Gen {ui,..., u ;; }, entonces proy^y = y. 


Este resultado también se deduce del siguiente teorema. 


Teorema de la mejor aproximación 

W es un subespacio de R", y es cualquier vector en R", y y es la proyección ortogonal de 
y sobre W. Entonces y en W es el punto más cercano a y, en el sentido de que 

lly - yll < lly - v|| (3) 

para toda v en W diferente de y. 


El vector y del teorema 9 se llama la mejor aproximación a y por elementos de W. 

En secciones posteriores del libro se examinarán problemas donde una y dada se debe rem¬ 
plazar, o aproximar , mediante un vector v en algún subespacio W fijo. La distancia de y a v, 
dada por ||y — v||, se puede considerar como el “error” de usar v en lugar de y. El teorema 9 
afirma que este error se minimiza cuando v = y. 

La desigualdad (3) conduce a una nueva demostración de que y no depende de la base 
ortogonal particular empleada para calcularlo. Si se utilizara una base ortogonal diferente 
para W con la finalidad de construir una proyección ortogonal de y, entonces esta proyección 
también sería el punto en W más cercano a y, a saber, y. 

DEMOSTRACION Tome v en W diferente de y. Véase la figura 4. Entonces y — v está en W. 
De acuerdo con el teorema de descomposición ortogonal, y — yes ortogonal a W. En particu¬ 
lar, y — y es ortogonal ay - v (que está en W). Puesto que 

y - V = (y - y) + (y - v) 

entonces, al utilizar el teorema de Pitágoras, se obtiene 

lly - v || 2 = lly - yll 2 + lly-vil 2 

(Véase el triángulo rectángulo a la derecha de la figura 4. Se indica la longitud de cada 
lado). Ahora ||y — v|| 2 > 0 porque y — v V 0, y así se deduce inmediatamente la desi¬ 
gualdad (3). ■ 



lly-vil 


FIGURA 4 La proyección ortogonal de y sobre 
W es el punto en W más cercano a y. 
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TEOREMA 10 


WEB 


EJEMPLO 3 Si ui = 

2” 

5 

, u 2 = 

2“ 

1 

. y = 

T 

2 


-1 


1 


3 


el ejemplo 2, entonces el punto en W más cercano a y es 


y = 


yui yu 2 

-Ui H-U2 = 

Ui-Ui u 2 -u 2 


-2/5 

2 

1/5 


Gen {m, u 2 }, como en 


EJEMPLO 4 La distancia de un punto y en R" a un subespacio W se define como la 
distancia de y al punto más cercano en W. Encuentre la distancia de y a W = Gen {ui, u 2 ¡, 
donde 



"-i " 


5" 


1 " 

y = 

-5 

10 

, Ui = 

-2 

1 

< u 2 = 

2 

-1 


SOLUCIÓN De acuerdo con el teorema de la mejor aproximación, la distancia de y a W es 
||y — y||, donde y = proyir y. Ya que {ui, u 2 } es una base ortogonal para W, 


15 

y = —ui + 

J 30 


-21 

~ 6 ~ 


Uo = — 
- 2 


5 

-2 

1 


~-l" 


"-1" 


"0" 

-5 

— 

-8 

= 

3 

10 


4 


6 


y-y = 


||y-y|| 2 = 3 2 + 6 2 = 45 


-1 

-8 

4 


La distancia de y a W es V45 = 3^5. 


El teorema final en esta sección muestra cómo la fórmula (2) para proyu- y se simpli¬ 
fica cuando la base para W es un conjunto ortonormal. 

Si {ui,..., u ; ,} es una base ortonormal para un subespacio W de R”, entonces 

proytry = (yui)m + (y-u 2 )u 2 + ••• + (y-u p )u p (4) 

Si U = fui u 2 ••• u /; ], entonces 

proyi^y = UUT y para toda y en R" (5) 

DEMOSTRACIÓN La fórmula (4) se obtiene inmediatamente de la ecuación (2) del 
teorema 8. Además, la ecuación (4) indica que proyu- y es una combinación lineal de las 
columnas de U empleando los pesos y-Ui, yu 2 ,..., yu p . Los pesos se pueden represen¬ 
tar como ufy, u^y.u p y, probando que son las entradas en U T y, y justificando la 

ecuación (5). ■ 


Suponga que U es una matriz de n x p con columnas ortonormales, y sea W el espacio 
columna de U. Entonces, 

U T Ux = I p x = x para toda x en R^ Teorema 6 
UU T y = proyvr y para toda y en R" Teorema 10 

Si U es una matriz (cuadrada) de n x n con columnas ortonormales, entonces U es una matriz 
ortogonal, el espacio columna W es todo de R", y UU T y = I y = y para toda y en R". 

Aunque la fórmula (4) es importante para fines teóricos, en la práctica generalmente 
implica algunos cálculos con raíces cuadradas de números (en las entradas de u,). La fórmula 
(2) se recomienda para cálculos a mano. 
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PROBLEMA DE PRÁCTICA 










-7 


-1 


-9 


Sean ui = 

1 

, u 2 = 

1 

> y = 

1 

y W 


4 


-2 


6 



de que y 112 son ortogonales, calcule proy U / y. 


Gen {ui, U 2 }. Con base en el hecho 


6.3 EJERCICIOS 

En los ejercicios 1 y 2, se puede suponer que {ui,..U 4 ¡ es una base 
ortogonal para IR 4 . 



~ 0 " 


"3~ 


1 ~ 


" 5~ 


1 


5 


0 


-3 

Ui = 

-4 

, u 2 = 

1 

, u 3 = 

1 

, u 4 = 

-1 


-1 


1 


-4 


1 


10 

-8 

2 

0 


. Escriba x como la suma de dos vectores, uno 


en Gen ¡uj, u 2 , U 3 ¡ y el otro en Gen ¡U 4 ¡. 


2. U! = 


' 1 " 


"- 2 ~ 


1 _ 


'-1 ' 

2 


1 


1 


1 

1 

, u 2 = 

-1 

, u 3 = 

-2 

, u 4 = 

1 

1 


1 


-1 


-2 


Escriba v como la suma de dos vectores, uno en 


Gen {ui} y el otro en Gen ¡u 2 , 113 , U 4 }. 

En los ejercicios 3 a 6 , compruebe que ¡Ui, U 2 } es un conjunto or¬ 
togonal, y luego encuentre la proyección ortogonal de y sobre Gen 
{Ui, u 2 }. 


3- y = 


4. v = 


5. y = 


-1 

4 

3 

6' 

3 

—2 

-1 

2 

6 


«1 = 


Ui 


Ui 


1 

1 

0 

3' 

4 

0 

3 

-1 

2 


U2 = 


U 2 


-1 

1 

0 

—4" 
3 
0 


U2 = 


1 

-1 

-2 


8 . y = 


9. y = 


10 . y = 


-1 

4 

3 

4' 

3 

3 

-1 

3' 

4 

5 

6 


. Ul 


Ul = 


Ui = 


, U 2 


U 2 


U 2 


-1 

3 

—2 

-1 

3 

1 

—2 

' 1 ' 
0 
1 
1 


U 3 = 


u 3 = 


En los ejercicios 11 y 12, determine el punto más cercano a y en el 
subespacio W generado por y v 2 . 


11 . y = 


12 . y = 


3 

1 

5 

1 

3' 

-1 

1 

13 


, Vi 


, v 2 


1 

-1 

1 

-1 


. Vi 


. V 2 


-4' 

1 

0 

3 


En los ejercicios 13 y 14, calcule la mejor aproximación a z con vec¬ 
tores de la forma ciVi + c 2 v 2 . 



3~ 


2 “ 


1 ' 


-7 


-1 


1 

z = 

2 

, Vi = 

-3 

. v 2 = 

0 


3 _ 


1 


-1 


2 “ 


2 “ 


5~ 


4 


0 


-2 

z = 

0 

, Vi = 

-1 

, V 2 = 

4 


-1 


-3 


2 



L 


L 


L 


5 “ 


"-3~ 


-3~ 


"6~ 


'-4~ 


"0~ 

15. Sean y = 

-9 

, Ul = 

-5 

, u 2 = 

2 

y = 

4 

, U] = 

-1 

, U 2 = 

1 


5 


1 


1 


1 


1 


1 

distancia de y al plano en [R 3 generado por 

ui y u 


En los ejercicios 7 a 10, sea W el subespacio generado por los vec¬ 
tores u, y escriba y como la suma de un vector en W y un vector 


. Encuentre la 


16. Sean y, vi y v 2 como en el ejercicio 12. Encuentre la distancia 
de y al subespacio de IR 4 generado por y v 2 . 


ortogonal a W. 






"4~ 


'2/3 


'-2/3 


' 1 " 


1 " 


"5~ 

17. Sean y = 

8 

, Ui = 

1/3 

, u 2 = 

2/3 

7. y = 

3 

. Ui = 

3 

. u 2 = 

1 


1 


2/3 


1/3 _ 


5 


-2 


4 

W = Gen {ui, u 2 }. 







6.3 Proyecciones ortogonales 353 


a ) Sea U = [Ui u 2 ]. Calcule U T U y UU T . 

b) Calcule proyjy y y (UU T )y. 


'7' 


í/x/To' 

9 

» Ul = 

-3/VTÓ. 


18 . Sean y = 


U T U y UU T . 

b) Determine proy^ y y (UU T )y. 


y W = Gen {ui¡. 

nica columna es ui. Calcule 



1 ' 


5 “ 


"0~ 

19 . Sean Ui = 

1 

. u 2 = 

-1 

y u 3 = 

0 


-2 


2 


1 


. Observe 


que 


ui y u 2 son ortogonales, pero que 113 no es ortogonal aujo u 2 . 
Es posible demostrar que 113 no está en el subespacio W gene¬ 
rado por ui y u 2 . Con base en este hecho, construya un vector v 
diferente de cero en IR 3 que sea ortogonal a ui y u 2 . 


20 . 


Sean ui y u 2 como en el ejercicio 19 , y 114 = 


0 

1 

0 


. Es posi¬ 


ble demostrar que 114 no está en el subespacio W generado por 
ui y u 2 . Con base en este hecho, obtenga un vector v diferente 
de cero en IR 3 que sea ortogonal a u¡ y u 2 . 


En los ejercicios 21 y 22 , todos los vectores y subespacios están 
en IR". Marque cada enunciado como verdadero o falso. Justifique 
sus respuestas. 


21 . a) Si z es ortogonal a ui y a u 2 , y si W = Gen ¡m, u 2 }, enton¬ 
ces z debe estar en VE 3 -. 

b) Para cada y y cada subespacio W, el vector y — proyvr y 
es ortogonal a W. 

c) Algunas veces y, la proyección ortogonal de y sobre un 
subespacio W , puede depender de la base ortogonal de W 
empleada para calcular y. 

d) Si y está en un subespacio W, , entonces la proyección orto¬ 
gonal de y sobre W es y misma. 


e) Si las columnas de una matriz Í7 de n x p, son ortonorma- 
les, entonces UU T y es la proyección ortogonal de y sobre 
el espacio columna de U. 

22. a) Si W es un subespacio de IR" y si v está en W y en VE 3 -, en¬ 

tonces v debe ser el vector cero. 
tí) En el teorema de descomposición ortogonal, cada término 
en la fórmula (2) para y es en sí mismo una proyección de y 
sobre un subespacio de W. 

c) Si y = zi + z 2 , donde z¡ está en un subespacio W y z 2 está 
en VE 3 -, entonces zi debe ser la proyección ortogonal de y 
sobre W. 

d ) La mejor aproximación a y por elementos de un subespacio 
W está dada por el vector y — proyw y. 

e) Si una matriz U de n x p, tiene columnas ortonormales, en¬ 
tonces UU T x = x para toda x en IR". 

23. Sea A una matriz de m x n. Demuestre que cada vector x en IR" 
se puede escribir en la forma x = p + u, donde p está en Fil A 
y u pertenece a Nul A. Además, demuestre que si la ecuación 
Ax = b es consistente, entonces existe una única p en Fil A tal 
que Ap = b. 

24. Sea W un subespacio de IR” con una base ortogonal {wi,..., w p }, 
y sea {vi,..., v 9 ¡ una base ortogonal para VE 3 -. 

a) Explique por qué {wi,..., w p . Vi,..., v 9 ) es un conjunto or¬ 
togonal. 

tí) Explique por qué el conjunto del inciso a) genera a IR". 
c) Demuestre que dim W + dim W 1 - = n. 

25. [M] Sea U la matriz de 8 x 4 del ejercicio 36 de la sección 6.2. 
Encuentre el punto más cercano a y = (1, 1, 1, 1, 1, 1, 1, 1) en 
Col U. Escriba las instrucciones que utilizó para resolver este 
problema. 

26. [M] Sea U la matriz del ejercicio 25. Obtenga la distancia de b 
= (1, 1, 1, 1. -1, -1, -1, -l)a Col U. 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 

Calcule 


y-ui y-u 2 88 —2 

proyw y = -ui -I-u 2 = —ui + —u 2 

Ui*Ui u 2 -u 2 66 6 


"-7 

1 

- 1 " 


"- 9 " 

1 

1 

= 

1 

4 

3 

-2 


6 


En este caso, y resulta ser una combinación lineal de ui y u 2 , de manera que y está en W. 
El punto en W más cerca de y es y misma. 
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6.4 PROCESO DE GRAM-SCHMIDT 


El proceso de Gram-Schmidt es un sencillo algoritmo para obtener una base ortogonal u 
ortonormal para cualquier subespacio diferente de cero de R". Los dos primeros ejemplos 
de este proceso son para realizarse a mano. 




"3 


r 

*3 

EJEMPLO 1 Sea W = Gen {xi, X 2 }, donde x¡ = 

6 

y x 2 = 

2 



0 


2 


. Construya una 


base ortogonal {vi, V 2 } para W. 


SOLUCIÓN En la figura 1 se ilustra el subespacio W, junto con Xi, X 2 y la proyección p de 
X 2 sobre x¡. La componente de X 2 ortogonal a x¡ es X 2 — p, que está en W porque se forma a 
w partir de X 2 y de un múltiplo de Xj. Sea V| = X! y 



Í X 2 

- *2 

x 2 * X, 

■ 1 ' 

15 

'3' 


'o - 



v 2 - X 2 P - X 2 Xi - 

2 

— 

6 

= 

0 



Xl-Xi 

2 

45 

0 


2 


Entonces {vi, V 2 } es un conjunto ortogonal de vectores distintos de cero en W. Como 
dim W = 2, entonces el conjunto {vi, V 2 } es una base para W. ■ 


FIGURA 1 

Construcción de una base 
ortogonal ¡Vi, V 2 }. 


El siguiente ejemplo ilustra plenamente el proceso de Gram-Schmidt. Estúdielo con 
cuidado. 


EJEMPLO 2 



1 ' 


"0 


" 0 " 


1 


1 


0 

Xi = 

1 

, X 2 = 

1 

y x 3 = 

1 


1 


1 


1 


. Entonces, {xi, X 2 , X 3 } es. 


a todas luces, linealmente independiente y, por consiguiente, es una base para un subespacio 
W de R 4 . Construya una base ortogonal para W. 


SOLUCIÓN 

Paso 1. Sean vi = xi y W\ = Gen {xi} = Gen {vi}. 

Paso 2. Sea V 2 el vector producido al restar de X 2 su proyección sobre el subespacio W\. Es 
decir, sea 


v 2 = x 2 - proy^ x 2 


X2 • Vi 

= x?-Vi Ya que v¡ = Xi 

Vi-Vi 


"0 


" 1 ' 


"-3/4" 

1 

3 

1 


1/4 

1 

~~ 4 

1 


1/4 

1 


1 


1/4 


Como en el ejemplo 1, V 2 es la componente de X 2 ortogonal a x h y {vi, V 2 } es una base orto¬ 
gonal para el subespacio Wi generado por X! y X 2 . 

Paso 2' (opcional). Si es pertinente, escale V 2 para simplificar cálculos posteriores. Como V 2 
tiene entradas fracciónales, entonces es conveniente escalarlo por un factor de 4 y sustituir 
{vi, V 2 } por la base ortogonal 


" 1 " 


"-3" 

1 

/ 

1 

1 

- v 2 = 

1 

1 


1 


vi = 
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Paso 3. Sea V 3 el vector obtenido restando de X 3 su proyección sobre el subespacio Wj. Utilice 
la base ortogonal {vi, vi } para calcular esta proyección sobre Wy. 


Proyección Proyección de 
de X 3 sobre vi X 3 sobre v¿ 


1 1 

T 


"-3 


0 

X 3 -Vi X 3 -V2 , 2 

1 

2 

1 


2/3 

proy w x 3 — Vi + , , v 2 = 

2 Vi • Vi v 2 • v 2 4 

1 

+ l 2 

1 

— 

2/3 


1 


1 


2/3 


Entonces, V 3 es la componente de X 3 ortogonal a W 2 , a saber. 


v 3 = x 3 - proy W2 x 3 


"0 


0 


0 

0 


2/3 


-2/3 

1 


2/3 


1/3 

1 


2/3 


1/3 


Véase en la figura 2 un diagrama de esta construcción. Observe que V 3 está en W porque X 3 
y proyvv 2 X 3 están en W. Así, {vi, V2, V3} es un conjunto ortogonal de vectores diferentes de 
cero y, por lo tanto, un conjunto linealmente independiente en W. Observe que W es tridi¬ 
mensional porque está definido con una base de tres vectores. Por lo tanto, de acuerdo con 
el teorema de la base de la sección 4.5, { vi, vó, V3} es una base ortogonal para W. ■ 



FIGURA 2 Construcción de V 3 a partir de X 3 

ywv 


La demostración del siguiente teorema revela que esta estrategia realmente funciona. 
No se menciona el escalamiento de vectores porque solo se usa para simplificar los cálculos 
a mano. 


TEOREMA 11 


Proceso de Gram-Schmidt 

A partir de una base {xi,..., x ; ,} para un subespacio W de IR", se define 


Vi = Xj 

v 2 = x 2 - 
v 3 = x 3 - 


Vp = X p - 


X2’V! 

-Vi 

Vi - Vi 

x 3 - Vi x 3 • v 2 

-Vi -v 2 

Vi - Vi V 2 • V 2 


Xp - Vi x p • v 2 

-Vi --V 2 - ••• 

Vi - Vi V 2 • V 2 


Xp'Vp-1 

V p 

Vp-l'Vp-1 


1 


Entonces, {vi,..., v /; j es una base ortogonal para W. Además, 

Gen {vi,..., v¿} = Gen {xi,..., x^} para 1 < le < p 


( 1 ) 
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WEB 


DEMOSTRACIÓN Para 1 < k < p, sea W k = Gen {xi,..., x/..}. Establezca que Vi = Xi, 
por lo que Gen {vi} = Gen {xi}. Suponga que, para alguna k < p, se construyeron vi,..., v>, 
de manera que {vi,_, v¿} es una base ortogonal para W k . Se define 


Vk +1 = x*+t - proywfcXt+i (2) 

De acuerdo con el teorema de descomposición ortogonal, v^+i es ortogonal a 114. Observe 
que proyiy x¿+i está en W k y, por lo tanto, también en Wk+ 1 - Como x¿+i está en W*+ 1 , 
entonces también v*+i lo está (ya que Wr+i es un subespacio y es cerrado bajo la resta). 
Además, v *+1 A 0 porque x*+i no está en W k = Gen {xi,..., x/J. Por lo tanto, {vi,..., \ k \ 1 ! 
es un conjunto ortogonal de vectores distintos de cero en el espacio (k+ l)-dimensional 
W k+ 1 . De acuerdo con el teorema de la base de la sección 4.5, este conjunto es una base 
ortogonal para W¿+i- Por lo tanto, W k +1 = Gen {vi,..., v^+i}. El proceso se detiene cuando 
k + 1 = p. ■ 

El teorema 11 indica que cualquier subespacio W distinto de cero de IR" tiene una base 
ortogonal, porque una base ordinaria ¡Xi,..., x ;) ¡ siempre está disponible (de acuerdo con el 
teorema 11 de la sección 4.5), y el proceso de Gram-Schmidt solo depende de la existencia de 
proyecciones ortogonales sobre subespacios de W que ya tengan bases ortogonales. 


Bases ortonormales 

Una base ortonormal se construye con facilidad a partir de una base ortogonal {Vi,..., \ p }: 
simplemente se normalizan (es decir, se “escalan”) todas las v*. Cuando se trabajan proble¬ 
mas a mano, esto es más fácil que normalizar cada \ k conforme se vayan encontrando (porque 
evita la escritura innecesaria de raíces cuadradas). 

EJEMPLO 3 En el ejemplo 1 se construyó la base ortogonal 



"3~ 


"0" 

Vi = 

6 

, v 2 = 

0 


0 


2 


Una base ortonormal es 


Ul II vi II Vl 


1 

V45 


"3~ 


" 1 /V 5 " 

6 

= 

2/V5 

0 


0 


1 

Uó = -Vo 

l|v 2 || 


0 

0 

1 


Factorización QR de matrices 

Si una matriz A de m x n tiene columnas linealmente independientes Xi,..., x„, la aplica¬ 
ción del proceso de Gram-Schmidt (con normalizaciones) a xi,..., x„ equivale a factorizar 
A , como se describe en el siguiente teorema. Esta factorización se utiliza ampliamente en 
algoritmos computacionales para diversos cálculos, como la resolución de ecuaciones (que 
se analizó en la sección 6.5) y la determinación de valores propios (que se mencionó en los 
ejercicios de la sección 5.2). 
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TEOREMA 12 La factorización QR 

Si A es una matriz de m x n con columnas linealmente independientes, entonces A se 
puede factorizar como A = QR , donde Q es una matriz de m x n cuyas columnas for¬ 
man una base ortonormal para Col A, y R es una matriz triangular superior invertible 
de n x n con entradas positivas en su diagonal. 


DEMOSTRACIÓN Las columnas de A forman una base {xi,..., x„¡ para Col A. Construya 
una base ortonormal {ui,..., u„! para W = Col A con la propiedad (1) del teorema 11. Esta 
base se puede construir mediante el proceso de Gram-Schmidt o con alguna otra técnica. 
Sea 

Q = [ ui u 2 • • • u„ ] 

Para k = 1,..., n, x k está en Gen {xi,..., x k } = Gen {ui,..., ua}. Entonces existen constantes, 
rik,..., r kk , tales que 

xa = n ¿til +-b r kk u k + 0 -ua+i H-h 0-u„ 

Podemos suponer que r kk > 0. (Si r kk < 0, multiplique r kk y u* por — 1). Esto muestra que x k 
es una combinación lineal de las columnas de Q empleando como pesos las entradas del 
vector 

fGAl 


L o J 

Es decir, xa = Qr k ^M&k = 1 Sea R = [ri ••• r„]. Entonces, 

A = [ x, • • • x„ ] = [ Qn • • • Qr„ ] = QR 


El hecho de que R es invertible se deduce fácilmente del hecho de que las columnas de A son 
linealmente independientes (ejercicio 19). Como resulta evidente que R es triangular superior, 
sus entradas diagonales no negativas deben ser positivas. ■ 


EJEMPLO 4 Encuentre una factorización QR de A 


1 0 0 
1 1 0 
1 1 1 
1 1 1 


SOLUCIÓN Las columnas de A son los vectores Xi, x 2 y X 3 del ejemplo 2. En ese ejemplo, 
se encontró una base ortogonal para Col A = Gen {x¡, x 2 , X3}: 


1 


"-3" 


0 

1 

/ 

1 


-2/3 

1 

- v 2 = 

1 

, v 3 = 

1/3 

1 


1 


1/3 


Para simplificar la aritmética que sigue, escale V 3 dejando que V 3 = 3 V 3 . Después, normalice 
los tres vectores para obtener ui, u 2 y 113, y utilice esos vectores como las columnas de Q: 


1/2 

—3/VI2 

0 

1/2 

1/VÍ2 

- 2 /V 6 

1/2 

i/Vñ 

1 /V 6 

1/2 

1 /VT 2 

1 /V 6 
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Por construcción, las primeras k columnas de Q son una base ortonormal de Gen ¡ x i,..., x¿}. 
De la demostración del teorema 12, A = QR para alguna R. Para encontrar R, observe que 
Q t Q = I, porque las columnas de Q son ortonormales. De ahí que 


y 


Q t A = Q t (QR) = ir = r 


R = 


1/2 1/2 

—3/x/l2 \/yf\2 

0 —2/a/ó 


1/2 
\¡ \pY2 
1/V6 


"2 3/2 1 

0 3/VT2 2/Vñ 

_0 0 2/V6 


1/2 
i/Vñ 
1/V6 



1 

0 

0 " 


1 

1 

0 


1 

1 

1 

- 

1 

1 

1 


- NOTAS NUMÉRICAS - 

1. Cuando el proceso de Gram-Schmidt se ejecuta en una computadora, el error por 
redondeo puede crecer conforme se van calculando los vectores u*, uno por uno. 
Cuando j y k son grandes, pero diferentes, los productos interiores U/ ( quizá no 
sean suficientemente cercanos a cero. Esta pérdida de ortogonalidad se puede re¬ 
ducir de manera sustancial reordenando los cálculos. 1 Sin embargo, en vez de este 
método de Gram-Schmidt modificado se prefiere el método de la factorización QR 
basado en computadora porque conduce a bases ortonormales más exactas, aun 
cuando la factorización requiere casi el doble de aritmética. 

2. Para obtener una factorización QR de una matriz A, un programa de cómputo ge¬ 
neralmente multiplica A por la izquierda por una secuencia de matrices ortogonales 
hasta que A se transforme en una matriz triangular superior. Esta construcción es 
análoga a la multiplicación por la izquierda con matrices elementales que produce 
una factorización LU de A. 


PROBLEMA DE PRÁCTICA 


Sea W = Gen {xi, x 2 }, donde xi = 

1 " 
1 

y x 2 = 

1/3" 

1/3 

. Construya una base ortonormal 

para W. 

1 


-2/3 



6.4 EJERCICIOS 

En los ejercicios 1 a 6, el conjunto indicado es una base para un sub¬ 
espacio W. Utilice el proceso de Gram-Schmidt con la finalidad de 
obtener una base ortogonal para W. 


1 . 

3" 

0 


8“ 

5 

2. 

"0~ 

4 


5' 

6 


-1 


-6 


2 


-7 



1 Véase Fundamentáis of Matrix Computations , de David S. Watkins (Nueva York: John Wiley & Sons. 1991), 
pp. 167-180. 
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7. Encuentre una base ortonormal del subespacio generado por 
los vectores del ejercicio 3. 

8. Obtenga una base ortonormal del subespacio generado por los 
vectores del ejercicio 4. 

En los ejercicios 9 a 12, determine una base ortogonal para el espacio 
columna de cada matriz. 



En los ejercicios 13 y 14, las columnas de Q se obtuvieron aplicando 
el proceso de Gram-Schmidt a las columnas de A. Encuentre una ma¬ 
triz R triangular superior tal que A = QR. Compruebe su resultado. 



5/6 

- 1/6 

1/6 

5/6 

-3/6 

1/6 

1/6 

3/6 



'-2/7 5/7' 

5/7 2/7 

2/7 -4/7 
4/7 2/7 


19. Suponga que A = QR, donde Q es de m x n y R es de n x n. 
Demuestre que si las columnas de A son linealmente indepen¬ 
dientes, entonces R debe ser invertible. [Sugerencia: Estudie la 
ecuación Rx = 0 y considere el hecho de que A = QR]. 

20. Suponga que A = QR, donde R es una matriz invertible. 
Demuestre que A y Q tienen el mismo espacio columna. 
[Sugerencia: Dada y en Col A, demuestre que y = Qx para 
alguna x. Además, dada y en Col Q. demuestre que y = Ax 
para alguna x], 

21. Dada A = QR como en el teorema 12, describa cómo encontrar 
una matriz ortogonal Q\ de m x m y una matriz triangular su¬ 
perior invertible R de n x n tales que 

a - q { R ». 

La instrucción qr de MATLAB proporciona esta factorización 
QR “completa” cuando el rango de A = n. 

22. Sean Ui,. .., u p una base ortogonal para un subespacio W de IR", 
y T : IR" —> IR" definida por T(x) = proyvr x. Demuestre que T 
es una transformación lineal. 

23. Suponga que A = QR es una factorización QR de una matriz A 
de m x n (con columnas linealmente independientes). Particio- 
ne A como [Ai Ai], donde Ai tiene p columnas. Muestre cómo 
obtener una factorización QR de Ai, y explique por qué su fac¬ 
torización tiene las características adecuadas. 

24. [M] Utilice el proceso de Gram-Schmidt. como en el ejemplo 2, 
y obtenga una base ortogonal para el espacio columna de 


15. Encuentre una factorización QR de la matriz del ejercicio 11 . 

16. Obtenga una factorización QR de la matriz del ejercicio 12 . 

En los ejercicios 17 y 18 , todos los vectores y subespacios están en 
IR". Marque cada enunciado como verdadero o falso. Justifique sus 
respuestas. 

17. a) Si ¡Vi, V2, V3} es una base ortogonal para W, entonces la 

multiplicación de V3 por un escalar c da una nueva base orto¬ 
gonal ¡Vi, V2, CV3}. 

b ) El proceso de Gram-Schmidt aplicado a un conjunto lineal¬ 
mente independiente {xi,..., x p } produce un conjunto orto¬ 
gonal {vi,..., Vp} con la propiedad de que para cada k, los 
vectores vi,..., Vjt generan el mismo subespacio que se origi¬ 
nó porxi,..., x*. 

c ) Si A = QR, donde Q tiene columnas ortonormales, entonces 
R = Q T A. 

18. a) Si W = Gen {xi, X2, X3} con {xi, X2, X3} linealmente inde¬ 

pendiente, y si (Vi, V2, V3} es un conjunto ortogonal en W, 
entonces (vi, V2, V3} es una base para W. 

tí) Si x no está en un subespacio W, entonces x — proyiy x no 
es cero. 

c ) En una factorización QR, por ejemplo, A = QR (cuando 
A tiene columnas linealmente independientes), las colum¬ 
nas de Q forman una base ortonormal para el espacio co¬ 
lumna de A. 


-10 

13 

7 

-11 

2 

1 

-5 

3 

-6 

3 

13 

-3 

16 

-16 

-2 

5 

2 

1 

-5 

-7 


25. [M] Aplique el método expuesto en esta sección para obtener 
una factorización de la matriz del ejercicio 24. 

26. [M] En un programa de matrices, el proceso de Gram-Schmidt 
funciona mucho mejor con vectores ortonormales. Comenzan¬ 
do con xi,..., x p como en el teorema 11, sea A = [xi ••• x p ]. 
Suponga que Q es una matriz de n x k cuyas columnas forman 
una base ortonormal para el subespacio W k generado por las 
primeras k columnas de A. Entonces para x en IR", QQ T x es la 
proyección ortogonal de x sobre W¡, (teorema 10 de la sección 
6.3). Si Xjt+i es la siguiente columna de A, entonces la ecuación 
( 2 ) en la demostración del teorema 11 se convierte en 

v*+i = xa .- +1 - Q(Q T x k+ 1 ) 

(Los paréntesis en la ecuación anterior reducen el número de 
operaciones aritméticas). Sea 14+1 = v^_|_ 1 /1|v^_|_ 1 1|. La nueva 
Q para el siguiente paso es [Q u¡h-i]- Utilice este procedimien¬ 
to para calcular la factorización QR de la matriz del ejercicio 24. 
Escriba las instrucciones que utilice. 
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SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Sean vi = x¡ = 


1 

1 

1 


y y 2 = x 2 


X2 • V] 

-vi = X 2 — Ovi = X 2 . Así, {xi, x-ij ya es orto- 

vr Vi 


gonal. Ahora todo lo que se necesita es normalizar los vectores. Sea 


Ul 


1 _ 1 
Vi II Vl V3 


■ 1" 


"1/V3" 

1 

= 

1/V3 

1 


_1/V3_ 


En vez de normalizar V 2 directamente, se normaliza vl = 3v2: 


U2 = 



1 

y/í 2 + l 2 + (-2) 2 


r 


1/V6" 

i 

= 

1/V6 

-2 


_-2/V6_ 


Entonces, {ui, U 2 ! es una base ortonormal para W. 


6.5 


PROBLEMAS DE MÍNIMOS CUADRADOS 


El ejemplo introductorio a este capítulo describió un enorme problema del tipo Ax = b que 
no tuvo solución. En las aplicaciones son frecuentes los sistemas inconsistentes, aunque por 
lo general no aparecen matrices de coeficientes tan grandes. Cuando se pide una solución y 
esta no existe, lo mejor que se puede hacer es encontrar una x tal que Ax esté lo más cerca 
posible de b. 

Piense que Ax es una aproximación a b. Cuanto menor sea la distancia entre b y Ax, 
dada por ||b — Ax||, mucho mejor será la aproximación. El problema general de mínimos 
cuadrados consiste en encontrar una x que haga a ||b — Ax|| tan pequeña como sea posible. 
El adjetivo “mínimos cuadrados” se origina en el hecho de que ||b — Ax|| es la raíz cuadrada 
de una suma de cuadrados. 


DEFINICIÓN 


Si A es de m x/iyb está en R"', una solución de mínimos cuadrados de Ax = b es 
un x en R" tal que 

l|b - Ax|| < ||b - Ax|| 

para toda x en R". 


El aspecto más importante del problema de mínimos cuadrados es que sin importar cuál 
x se seleccione, el vector Ax necesariamente estará en el espacio columna. Col A. Así que 
se busca un vector x que haga que Ax sea el punto en Col A más cercano a b. Véase la figura 
1 . (Desde luego, si b resulta estar en Col A, entonces b es Ax para alguna x, y tal x es una 
“solución de mínimos cuadrados”). 



Ax 


FIGURA 1 El vector b está más cerca de Ax 
que de Ax para otra x. 
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Solución del problema general de mínimos cuadrados 

Con base en los A y b anteriores, aplique el teorema de la mejor aproximación que se expuso 
en la sección 6.3 al subespacio Col A. Sea 

b= proycoiA b 

Como b está en el espacio columna de A, la ecuación Ax = bes consistente, y existe una b 
en IR" tal que 

Ax = b (1) 

Como b es el punto en Col A más cercano a b, un vector x es una solución de mínimos cua¬ 
drados de Ax = b si y solo si x satisface la ecuación (1). Tal xen R" es un lista de pesos para 
construir b a partir de las columnas de A. Véase la figura 2. [Existen muchas soluciones de 
la ecuación (1) si tiene variables libres]. 



FIGURA 2 La solución de mínimos cuadrados xestá en IR". 


Suponga que x satisface Ax = b. Según el teorema de descomposición ortogonal de la 
sección 6.3, la proyección b tiene la propiedad de que b — b es ortogonal a Col A, de manera 
que b — Ax es ortogonal a cada columna de A. Si a ¡ es cualquier columna de A, entonces 
a j • (b — Ax) = 0 y aj (b — Ax) = 0. Como cada a^ es una fila de A r , 


A T (b — Ax) = 0 


( 2 ) 


(Esta ecuación también se deduce del teorema 3 de la sección 6.1). Así, 


A r b - A t Ax = 0 

A T Ax = A t b 

Estos cálculos indican que cada solución de mínimos cuadrados de Ax = b satisface la 
ecuación 

A t Ax = A r b (3) 

La ecuación matricial (3) representa un sistema de ecuaciones llamado las ecuaciones nor¬ 
males para Ax = b. Es frecuente que cada solución del sistema (3) se denote con x. 


TEOREMA 13 


El conjunto de soluciones de mínimos cuadrados de Ax = b coincide con el conjunto 
no vacío de soluciones de las ecuaciones normales A r Ax = A r b. 


DEMOSTRACIÓN Como ya se mostró antes, el conjunto de soluciones de mínimos cuadra¬ 
dos es no vacío y cada solución de mínimos cuadrados x satisface las ecuaciones normales. 
A la inversa, suponga que x satisface A r Ax = A r b. Entonces, x satisface la ecuación (2) an¬ 
terior, lo que demuestra que b — Ax es ortogonal a las filas de A 7 y, por lo tanto, ortogonal 
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a las columnas de A. Como las columnas de A generan Col A, entonces el vector b — Ax 
es ortogonal a todo elemento de Col A. Por consiguiente, la ecuación 

b = Ax + (b — Ax) 


es una descomposición de b en la suma de un vector en Col A y de un vector ortogonal a 
Col A. Por la singularidad de la descomposición ortogonal, Ax debe ser la proyección orto¬ 
gonal de b sobre Col A. Es decir, Ax = b, y x es una solución de mínimos cuadrados. ■ 

EJEMPLO 1 Encuentre una solución de mínimos cuadrados del sistema inconsistente 
Ax = b para 



4 

0 


2 

A = 

0 

2 

, b = 

0 


1 

1 


11 


SOLUCIÓN Para emplear las ecuaciones normales (3), calcule 


A T A = 


4 

0 


0 1 
2 1 


A r b 


4 0 1 
0 2 1 


4 0 

0 2 
1 1 



'i7 r 


1 5 


2 

0 

11 



Entonces, la ecuación A T Ax = A r b se convierte en 


' 17 

r 

Xl 


' 19' 

1 

5 

_X 2 _ 


11 


Pueden utilizarse operaciones de fila para resolver este sistema, pero como A r A es de 2 x 2 
e invertible, tal vez sea más rápido calcular 


(A T A)~ l 


1 

84 


5 -1 
-1 17 


y luego resolver A r Ax = A r b como 


x = (A 7 A)“ 1 A r b 


1 

5 

-1' 

' 19' 

1 

r 84 i 


T 

84 

-1 

17 

11 

“ 84 

OO 

V .O 


2 


En muchos cálculos, A r A es invertible, pero este no siempre es el caso. El siguiente 
ejemplo implica a una matriz como las que suelen presentarse en estadística, en problemas de 
análisis de varianza. 

EJEMPLO 2 Encuentre una solución de mínimos cuadrados de Ax = b para 


" 1 

1 

0 

0 


~-3~ 

1 

1 

0 

0 


-1 

1 

0 

1 

0 


0 

1 

0 

1 

0 

, b = 

2 

1 

0 

0 

1 


5 

1 

0 

0 

1 


1 
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SOLUCIÓN Calcule 


a t a = 


A t b = 








" 1 

1 

0 

0' 





■ 1 

1 

1 

1 

1 

r 


1 

1 

0 

0 


'6 

2 

2 

2" 

1 

1 

0 

0 

0 

0 


1 

0 

1 

0 


2 

2 

0 

0 

0 

0 

1 

1 

0 

0 


1 

0 

1 

0 


2 

0 

2 

0 

0 

0 

0 

0 

1 

1 


1 

0 

0 

1 


2 

0 

0 

2 







1 

0 

0 

1 











'-3' 









■ 1 

1 

1 

1 

1 

r 


-1 



4" 






1 

1 

0 

0 

0 

0 


0 


- 

-4 






0 

0 

1 

1 

0 

0 


2 



2 






0 

0 

0 

0 

1 

1 


5 



6 












1 










La matriz aumentada para A r Ax = A r b es 


"6 

2 

2 

2 

4" 


' 1 

0 

0 

1 

3" 

2 

2 

0 

0 

-4 


0 

1 

0 

-1 

-5 

2 

0 

2 

0 

2 


0 

0 

1 

-1 

-2 

2 

0 

0 

2 

6 


0 

0 

0 

0 

0 


La solución general es x¡ = 3 — X\, X2 = — 5 + X\, x¡ = —2 + X4, y X4 es libre. Así, la so¬ 
lución general de mínimos cuadrados de ,4x = b tiene la forma 



3 


- 1 " 


-5 

+ X4 

1 

X = 

-2 

1 


0 


1 


El siguiente teorema brinda útiles criterios para determinar cuándo existe solamente una 
solución de mínimos cuadrados de Ax = b. (Desde luego, la proyección ortogonal b siempre 
es única). 


TEOREMA 14 Sea A una matriz de m x n. Los siguientes enunciados son lógicamente equivalentes: 

a) La ecuación Ax = b tiene una solución de mínimos cuadrados única para cada b 
en R m . 

b ) Las columnas de A son linealmente independientes. 

c) La matriz A r A es invertible. 

Cuando estos enunciados son verdaderos, la solución x de mínimos cuadrados está 
dada por 

x = (A J Ar 1 A r b (4) 


En los ejercicios 19 a 21 se indican los elementos principales para demostrar el teore¬ 
ma 14; en tales ejercicios también se revisan conceptos del capítulo 4. La fórmula (4) para x 
es útil sobre todo para fines teóricos y cálculos a mano cuando A r A es una matriz invertible 
de 2 x 2. 

Cuando se usa una solución x de mínimos cuadrados para producir Ax como una apro¬ 
ximación a b, entonces la distancia de b a Ax se llama el error de mínimos cuadrados de 
esta aproximación. 

EJEMPLO 3 Dados A y b como en el ejemplo 1, determine el error de mínimos cuadra¬ 
dos en la solución de mínimos cuadrados de Ax = b. 
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SOLUCIÓN A partir del ejemplo 1, 


2 

0 

¡*!> 

II 

4 

0 

0" 

2 

T 

O 

_ 

"4" 

4 

11 


1 

1 

z 


3 


Por lo tanto. 


2 


"4" 


<N 

1 

0 

— 

4 

= 

-4 

11 


3 


1 

00 

_1 


y 

||b - Ax|| = V(-2) 2 + (— 4) 2 + 8 2 = V84 

El error de mínimos cuadrados es VB4- Para cualquier x en R 2 , la distancia entre b y el vector 
Ax es al menos \/84. Véase la figura 3. Observe que la solución x de mínimos cuadrados no 
se presenta en la figura. ■ 


Cálculos alternativos de soluciones de mínimos cuadrados 

El siguiente ejemplo muestra cómo encontrar una solución de mínimos cuadrados de Ax = b 
cuando las columnas de A son ortogonales. Con frecuencia tales matrices se presentan en 
problemas de regresión lineal, como los que se analizarán en la siguiente sección. 


EJEMPLO 4 Encuentre una solución de mínimos cuadrados de Ax = b para 


"1 

-6 


-1' 

1 

-2 


2 

1 

1 

, b = 

1 

1 

7 


6 


SOLUCIÓN Como las columnas a¡ y de A son ortogonales, la proyección ortogonal de b 
sobre Col A está dada por 


- b-a. b-ai 

b = -ai d- ñ2 

ai • ai ü 2 ‘ a2 




2 

2 

2 

+ 

" -3 
-1 
1/2 

= 

-1 

1 

5/2 

2 


7/2 


11/2 


(5) 


Ahora que se conoce b, se puede resolver Ax = b. Pero esto es trivial, porque ya se sabe 
que los pesos a colocar sobre las columnas de A producen b. A partir de la ecuación (5) es 
claro que 


8/4 


2 

45/90 


M 2 . 


En algunos casos, es posible que las ecuaciones normales para un problema de mínimos 
cuadrados estén mal condicionadas ; es decir, en ocasiones, pequeños errores en los cálculos 
de las entradas de A r A causan grandes errores en la solución x. Si las columnas de A son 
linealmente independientes, la solución de mínimos cuadrados con frecuencia se puede calcu¬ 
lar de manera más confiable con una factorización QR de A (descrita en la sección 6.4). 1 


1 El método QR se compara con el método de la ecuación normal estándar en G. Golub y C. Van Loan, Matrix 
Computations , 3a. ed. (Baltimore: Johns Hopkins Press, 1996). pp. 230-231. 
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Dada una matriz A de m x n, con columnas linealmente independientes, sea A = QR 
una factorización QR de A como en el teorema 12. Entonces, para cada b en R'", la 
ecuación Ax = b tiene una solución de mínimos cuadrados única, dada por 

x = R~ l Q T b (6) 


DEMOSTRACIÓN Seax = R 1 Q T b. Entonces, 

Ax = QRx = QRR~ x Q t b = QQ r b 

De acuerdo con el teorema 12, las columnas de Q forman una base ortonormal para Col A. 
Por lo tanto, según el teorema 10, QQ T b es la proyección ortogonal b de b sobre Col A. Así, 
Ax = b, lo que muestra que x es una solución de mínimos cuadrados de Ax = b. La unicidad 
de x se deduce del teorema 14. ■ 

- NOTA NUMÉRICA - 

Como en el teorema 15, R es triangular superior, entonces x se debería calcular como 
la solución exacta de la ecuación 

Rx = Q T b (7) 

Es mucho más rápido resolver (7), por sustitución hacia atrás o mediante operaciones 
de fila, que calcular R 1 y utilizar la ecuación (6). 


EJEMPLO 5 Encuentre la solución de mínimos cuadrados de Ax = b para 


1 

3 

5 


3" 

1 

1 

0 


5 

1 

1 

2 

, b = 

7 

1 

3 

3 


-3 


SOLUCIÓN La factorización QR de A se obtiene como en la sección 6.4 


Luego, 


” 1/2 

1/2 

1 / 2 " 


1/2 

- 1/2 

- 1/2 


1/2 

- 1/2 

1/2 


1/2 

1/2 

- 1/2 

- 


5 

3 

2 



"1/2 

1/2 

1/2 

1/2 

Q T b = 

1/2 

-1/2 

-1/2 

1/2 


1/2 

-1/2 

1/2 

-1/2 


La solución de mínimos cuadrados x satisface Rx = Q T \y, es decir, 


"2 

0 

4 5" 
2 3 

1 

<N 

X X 

1_ 

_ 

6" 

-6 

0 

0 2 

L*3_ 


4 


10 

-6 

2 


Esta ecuación se resuelve fácilmente y conduce a x = 
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PROBLEMAS DE PRACTICA 


1. Sean A 


1 -3 -3 
1 5 1 y b 

17 2 ’ 


—3 . Encuentre una solución de mínimos cuadra¬ 


dos de Ax = b, y calcule el error de mínimos cuadrados asociado. 

2. ¿Qué se puede decir acerca de la solución de mínimos cuadrados de Ax = b cuando b es 
ortogonal a las columnas de A? 


6.5 EJERCICIOS 

En los ejercicios 1 a 4. encuentre una solución de mínimos cuadrados 
de Ax = b mediante a) la construcción de las ecuaciones normales 
para x y b) el despeje de x. 


1. A = 


2. A = 


3. A = 


4. A = 


-12 4 

2 -3 ,b= 1 

-13 2 


2 1 

-2 0 , b = 

2 3 


1 3 5 

1 -1 ,b = 1 

1 1 0 


En los ejercicios 5 y 6, describa todas las soluciones de mínimos 
cuadrados de la ecuación Ax = b. 


1 1 0 
1 1 0 
1 0 1 
1 0 1 


7. Calcule el error de mínimos cuadrados asociado con la solución 
de mínimos cuadrados que encontró en el ejercicio 3. 

8. Determine el error de mínimos cuadrados asociado con la solu¬ 
ción de mínimos cuadrados que encontró en el ejercicio 4. 

En los ejercicios 9 a 12. encuentre a) la proyección ortogonal de b 
sobre Col Ay tí) una solución de mínimos cuadrados de Ax = b. 


9. A = 


1 5 

3 1 ,b = 

-2 4 


10. A = 


11. A = 


12. A = 


1 2 

-1 4 ,b = 

1 2 _ 

4 o r 

1 -5 1 . 

6 1 0 ’ fc 

1 -1 -5 


1 1 0 

1 0 - 1 K_ 

0 1 1 ,b 

-1 1 -1 



"9" 

, b = 

0 

0 


0 


13. Sean A = 


5" 

-2 ' 


4 

1 , b = 
4 


5' 

U= [-l_ 


Calcule Au y Av, y compárelos con b. ¿Podría ser u 


una solución de mínimos cuadrados de Ax = b? (Responda sin 
calcular una solución de mínimos cuadrados). 

' 2 n r s i r 4i 

14. Sean A= —3— 4,b= 4,u= yv = 

32 4 J 


y v = 


6 " 

_ —5 _' 


Determine Au y Av, y compárelos con b. ¿Es posible 


que al menos uno de los dos entre u o v sea una solución de 
mínimos cuadrados de Ax = b? (Responda sin obtener una 
solución de mínimos cuadrados). 

En los ejercicios 15 y 16, utilice la factorización A = QR para encon¬ 
trar la solución de mínimos cuadrados de Ax = b. 

'2 31 T 2/3 -1/31|- -, Yl~ 

15. A = 2 4 = 2/3 2/3 * i* ,b = 3 

1 1 1/3 -2/3 L u J ! 


1/2 - 1/2 
1/2 1/2 
1/2 - 1/2 
1/2 1/2 


’ 2 3 1 K 

0 5 J’ b 


En los ejercicios 17 y 18, A es una matriz de m x n y b está en IR™. 
Marque cada enunciado como verdadero o falso. Justifique sus res¬ 
puestas. 

17. a) El problema de mínimos cuadrados general consiste en obtener 
una x que haga que Ax esté tan cerca de b como sea posible. 
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b) Una solución de mínimos cuadrados de Ax = b es un vector 
x que satisface Ax = b, donde b es la proyección ortogonal 
de b sobre Col A. 

c) Una solución de mínimos cuadrados de Ax = b es un vector 
x tal que ||b — Ax|| < ||b — Ax|| para toda x en IR”. 

d) Cualquier solución de A T Ax = A T b es una solución de míni¬ 
mos cuadrados de Ax = b. 

e) Si las columnas de A son linealmente independientes, enton¬ 
ces la ecuación Ax = b tiene exactamente una solución de 
mínimos cuadrados. 

18. a) Si b está en el espacio columna de A, entonces cada solución 

de Ax = b es una solución de mínimos cuadrados. 

b ) La solución de mínimos cuadrados de Ax =b es el punto en 
el espacio columna de A más cercano a b. 

c) Una solución de mínimos cuadrados de Ax = b es una lista 
de pesos que, cuando se aplica a las columnas de A, produce 
la proyección ortogonal de b sobre Col A. 

d) Si x es una solución de mínimos cuadrados de Ax = b, 
entonces x = (A r A) _1 A r b. 

e) Las ecuaciones normales siempre ofrecen un método confia¬ 
ble para calcular soluciones de mínimos cuadrados. 

/) Si A tiene una factorización QR, por ejemplo, A = QR, en¬ 
tonces la mejor manera de obtener una solución de mínimos 
cuadrados de Ax = b es calcular x = R~ l Q T b. 

19. Sea A una matriz de m x n. Realice los siguientes pasos para 
demostrar que un vector x en IR" satisface Ax = 0 si y solo si 
A T Ax = 0. Esto demostrará que NulA = Nul A r A. 

a) Demuestre que si Ax = 0, entonces A T Ax = 0. 

b) Suponga que A T Ax = 0. Explique por qué x T A T Ax = 0, y 
use esto para probar que Ax = 0. 

20. Sea A una matriz de m x n tal que A r A es invertible. Demuestre 
que las columnas de A son linealmente independientes. [Pre¬ 
caución: No suponga que A sea invertible; es más, tal vez ni 
siquiera sea cuadrada], 

21. Sea A una matriz de m x n cuyas columnas son linealmente in¬ 
dependientes. [Precaución: A no necesariamente es cuadrada]. 
a) Con base en el ejercicio 19, demuestre que A T A es una matriz 

invertible. 

tí) Explique por qué A debe tener, al menos, tantas filas como 
columnas. 

c) Determine el rango de A. 

22. Con base en el ejercicio 19, demuestre que rango A T A = ran¬ 
go A. [Sugerencia: ¿Cuántas columnas tiene A r A? ¿Cómo se 
relaciona esto con el rango de A r A?]. 

23. Suponga que A es de m x n con columnas linealmente indepen¬ 
dientes y que b está en IR"'. Utilice las ecuaciones normales con 
la finalidad de obtener una fórmula para b, la proyección de b 
sobre Col A. [Sugerencia: Primero encuentre x. La fórmula no 
requiere una base ortogonal para Col A]. 


24. Obtenga una fórmula para la solución de mínimos cuadrados de 
Ax = b cuando las columnas de A son ortonormales. 

25. Describa todas las soluciones de mínimos cuadrados del 
sistema 

x + y = 2 
x + y = 4 


26. [M] El ejemplo 3 de la sección 4.8 mostró un filtro lineal pasa 
bajos que cambió la señal {} en ¡yr+i] y transformó la señal 
de alta frecuencia {wk} a una señal cero, donde yk = cos(77&/4) 
y Wk = cos(37tL/4). Los siguientes cálculos diseñarán un filtro 
con aproximadamente esas propiedades. La ecuación del fil¬ 
tro es 


«oLH -2 + aiy k +i + a 2 y k = Zk para toda k (8) 

Como las señales son periódicas, con periodo 8, basta con estu¬ 
diar la ecuación (8) para k = 0,.. .,7. La acción sobre las dos se¬ 
ñales descritas se traduce en dos conjuntos de ocho ecuaciones, 
que se muestran a continuación: 



yk+2 

yk- i-i 

yk 


yk+1 

k = 0 

0 

.7 

i" 


.7' 

k = 1 

-.7 

0 

.7 


0 


-1 

-.1 

0 




-.7 


-.7 

-1 

-.7 


fl 0 


-1 


0 

-.7 

-1 


a i 

— 

-.7 


.7 

0 

-.7 


a 2 


0 


1 

.7 

0 


.7 

k = 7 

.7 

1 

.7 


1 


k 

k 


k 


W k +2 Wk+l 

0 -.7 


.7 

-1 

.7 

0 

-.7 

1 

—.1 


0 

.7 

-1 

.7 

0 

—.7 

1 


w k 

1 

-.7 

0 

.7 

-1 

.7 

0 

-.7 


a o 
a { 
ai 


0 

0 

0 

0 

0 

0 

0 

0 


Escriba una ecuación Ax = b, donde A es una matriz de 16 x 3 
formada por las dos matrices de coeficientes anteriores y don¬ 
de b en IR 16 se forma a partir de los dos lados derechos de las 
ecuaciones. Encuentre ao, a i y a 2 dadas por la solución de mí¬ 
nimos cuadrados de Ax = b. (El .7 en los datos anteriores se 
empleó como una aproximación a x/2/2, para ilustrar cómo 
se procede en un cálculo típico en un problema aplicado. Si, en 
vez de ello, se utilizara .707, los coeficientes del filtro resultan¬ 
te concordarían, al menos, en siete decimales con \/2/4, 1/2 
y x/2/4, los valores obtenidos mediante cálculos aritméticos 
exactos). 


WEB 
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SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Primero calcule 



1 

1 

1 " 

"1 - 

3 - 

-3" 


"3 

9 

0" 

a t a = 

-3 

5 

7 

1 

5 

1 

= 

9 

83 

28 


-3 

1 

2 

1 

7 

2 


0 

28 

14 


1 

1 

1 " 

5" 


— 

-3" 




A t b = 

-3 

5 

7 

-3 

= 

— 

65 





-3 

1 

2 

-5 


- 

28 





Después, reduzca por filas la matriz aumentada para las ecuaciones normales A T Ax = A T b: 


"3 

9 

0 

-3 


" 1 

3 

0 

-1 " 


"1 

0 

-3/2 

2" 

9 

83 

28 

-65 

~ 

0 

56 

28 

-56 

— 

0 

1 

1/2 

-1 

0 

28 

14 

-28 


0 

28 

14 

-28 


0 

0 

0 

0 


La solución de mínimos cuadrados general es x\ = 2 + \x-y, xo = —1 — /xt, con xj 
libre. Para una solución específica, tome .q = 0 (por ejemplo), y obtenga 


2 

-1 

0 


Para encontrar el error de mínimos cuadrados, calcule 



Resulta que b = b, de manera que ||b — b|| = 0. El error de mínimos cuadrados es cero 
porque b está en Col A. 

2. Si b es ortogonal a las columnas de A, entonces la proyección de b sobre el espacio 
columna de A es 0. En este caso, una solución de mínimos cuadrados x de ,4x = b sa¬ 
tisface Ax = 0. 


6.6 APLICACIONES A MODELOS LINEALES 

Una tarea común en ciencia e ingeniería es analizar y entender relaciones entre diferentes 
cantidades que varían. Esta sección describe una variedad de situaciones en las que los datos 
se emplean para construir o comprobar una fórmula que predice el valor de una variable como 
función de otras variables. En cada caso, el reto será equivalente a resolver un problema de 
mínimos cuadrados. 

Para facilitar la aplicación del análisis a problemas reales que encontrará en sus activi¬ 
dades profesionales, se elige la notación que comúnmente se utiliza en el análisis estadístico 
de datos científicos y de ingeniería. En vez de escribir Ax = b, se escribe X(3 = y, donde X 

es la matriz de diseño, fi es el vector de parámetros y y es el vector de observaciones. 

Rectas de mínimos cuadrados 

La relación más sencilla entre dos variables x y y es la ecuación lineal y = /3o + fi\x. ] 
Con frecuencia los datos experimentales generan los puntos (x\, yi),..., (x n , y „) que, cuando 


1 Es común utilizar esta notación para rectas de mínimos cuadrados en vez de y = mx + b. 
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se grafican, parecen estar cerca de una recta. Se desea determinar los parámetros /3o y /3i 
para hacer que la recta esté lo más “cerca” posible de dichos puntos. 

Suponga que /3o y /3i están fijos, y considere la recta y = fío + ¡3\x de la figura 1. Para 
cada dato (x¡, yj) existe un punto (x¡, /3o + (i\x¡) sobre la recta con la misma coordenada x. Por 
otro lado, yj es el valor observado de y, y /3o + /3 \Xj es el valor predicho para y (determinado 
por la recta). La diferencia entre los valores observado y predicho para y se llama residuo. 


Punto dato 


kv, p 0 +p 1 x.) 


Punto sobre 
la recta Residuo - 


Residuo 


' v = 0o + /V 


FIGURA 1 Ajuste de datos experimentales a una recta. 


Existen varias maneras de medir qué tan “cerca” está la recta respecto de los datos. La 
elección habitual (sobre todo porque los cálculos matemáticos son sencillos) es sumar los 
cuadrados de los residuos. La recta de mínimos cuadrados es la recta y = /3o + ¡3\x que mi¬ 
nimiza la suma de los cuadrados de los residuos. A esta recta también se le conoce como recta 
de regresión de y sobre x, porque se supone que cualquier error en los datos solo ocurre en 
las coordenadas y. Los coeficientes /3o, /3i de la recta son los coeficientes de regresión. 2 

Si los puntos de los datos estuvieran sobre una recta, los parámetros /3o y /3i satisfarían 
las ecuaciones 


Valor 

predicho de y 

Valor 

observado de y 

/3o + jSuci 

yi 

/3o + P\X2 

yi 

/3 0 + ¡3\x n 

= y« 


Este sistema se puede representar como 



1 

X\ 




>’i 


1 

X 2 


'/3o' 

,/3i_ 


L2 

A/3 = y donde A = 

1 

X» _ 

. P = 

. y = 

_y n _ 


Desde luego, si los puntos de datos no están sobre una recta, entonces no existen parámetros 
/3 0 , /3| para los cuales los valores predichos de y en A/3 sean iguales a los valores observados 
de y en y, y X[3 = y no tiene solución. Este es un problema de mínimos cuadrados, Ax = b, 
¡con diferente notación! 

El cuadrado de la distancia entre los vectores A/3 y y es precisamente la suma de los 
cuadrados de los residuos. El /3 que minimiza esta suma también minimiza la distancia en¬ 
tre A/3 y y. Calcular la solución de mínimos cuadrados de Xf3 = y equivale a encontrar el 
vector /3 que determina la recta de mínimos cuadrados de la figura 1. 


2 Si los errores de medición estuvieran en x y no en y , simplemente se intercambiarían las coordenadas de los datos 
(Xj, yj) antes de trazar la gráfica de los puntos y calcular la recta de regresión. Si ambas coordenadas están sujetas 
a posibles errores, entonces se podría elegir la recta que minimiza la suma de los cuadrados de las distancias orto¬ 
gonales (perpendiculares) de los puntos a la recta. Véase los problemas de práctica de la sección 7.5. 
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EJEMPLO 1 Encuentre la ecuación y = /3o + ¡3\x de la recta de mínimos cuadrados que 
mejor se ajuste a los puntos de datos (2, 1), (5, 2), (7, 3) y (8, 3). 

SOLUCIÓN Utilice las coordenadas x de los datos para construir la matriz de diseño X en la 
ecuación (1) y las coordenadas y para construir el vector de observaciones y: 



Para la solución de mínimos cuadrados de X[3 = y, obtenga las ecuaciones normales (con la 
nueva notación): 

X T X/3 = X T y 

Es decir, calcule 



Las ecuaciones normales son 

4 2211" /3 0 1 _ [ 9 

22 142_||_/3i J “ [57 

Por lo tanto, 

/ 3 0 1 _ r 4 22]- 1 r 9] _ j_r 142 -22ir 9] _ j_r241 _ r 2/7" 

¡3\ \ ~ |_ 22 142 J |_ 57 J — 84 [ —22 4 J [ 57 J “ 84 |_ 30 J “ [ 5/14 

De manera que la recta de mínimos cuadrados tiene la ecuación 

2 5 

y = - + —x 


Véase la figura 2. 



Una práctica común, antes de calcular la recta de mínimos cuadrados, consiste en cal¬ 
cular el promedio x de los valores x originales y formar una nueva variable x* = x — x. Se 
dice que los nuevos datos x quedan en su forma de desviación media. En este caso, las dos 
columnas de la matriz de diseño serán ortogonales. Se simplifica la solución de las ecuacio¬ 
nes normales, justo como en el ejemplo 4 de la sección 6.5. Véase los ejercicios 17 y 18. 
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Modelo lineal general 

En algunas aplicaciones, es necesario ajustar puntos de datos a algo diferente de una línea 
recta. En los ejemplos que siguen, la ecuación matricial continúa siendo Xfí = y, pero la 
forma específica de X cambia de un problema a otro. Por lo general, los especialistas en es¬ 
tadística introducen un vector residual e, definido como e = y — Xfí, y que se escribe 

y = xp X e 

Cualquier ecuación de esta forma es un modelo lineal. Una vez que Xyy están determinadas, 
el objetivo es minimizar la longitud de e, lo que equivale a encontrar una solución de mínimos 
cuadrados de Xfí = y. En cada caso, la solución de mínimos cuadrados fi es una solución de 
las ecuaciones normales 

X T Xfí = X T y 

Ajuste de otras curvas con mínimos cuadrados 

Cuando los puntos de datos (x\, vi (x,„ y„) en una gráfica de dispersión no se encuen¬ 
tran cerca de una recta, tal vez resulte pertinente postular alguna otra relación funcional 
entre x y y. 

Los siguientes dos ejemplos muestran cómo ajustar datos mediante curvas que tienen la 
forma general 

y = Pofoix) X f>ifi(x) + ••• + p k f k (x ) (2) 

donde/o,. son funciones conocidas y /3o,..., [3i¡ son parámetros que se deben determinar. 
Como se verá, la ecuación (2) describe un modelo lineal porque es lineal en los parámetros 
desconocidos. 

Para un valor particular de x, la ecuación (2) da un valor predicho, o “ajustado”, de y. 
La diferencia entre el valor observado y el valor predicho es el residuo. Los parámetros 
fío,..., fík se deben determinar para minimizar la suma de los cuadrados de los residuos. 

EJ EM PLO 2 Suponga que los puntos de datos (x\ , yi),..., (x„, y„) parecen estar sobre una 
parábola y no sobre una recta. Por ejemplo, si la coordenada x denota el nivel de producción 
de una compañía, y y representa el costo promedio por unidad de operación en un nivel de 
x unidades por día, entonces una curva típica de costo promedio parece una parábola que se 
abre hacia arriba (figura 3). En ecología, se usa una curva parabólica que se abre hacia abajo 
para modelar la producción primaria neta de nutrientes en una planta, como una función del 
área superficial del follaje (figura 4). Suponga que deseamos aproximar los datos mediante 
una ecuación de la forma 

y = fí 0 + ¡í\x X p 2 x 2 (3) 

Describa el modelo lineal que produce un “ajuste de mínimos cuadrados” de los datos, 
empleando la ecuación (3). 

SOLUCIÓN La ecuación (3) describe la relación ideal. Suponga que los valores reales de 
y los parámetros son fío. fí¡, fío- Entonces las coordenadas del primer punto de datos (x¡, y i) 

satisfacen una ecuación de la forma 

yi = /3 0 + f¡iX\ + p 2 xf + ei 

donde es el error residual entre el valor observado y¡ y el valor predicho fío + fí¡xi + fí 2 x[ 
para y. Cada punto de datos determina una ecuación similar: 

y i = Po + f>ix¡ + fí 2 x\ X e\ 

yi = Po + fíiX 2 X /3 2 .Í2 + £2 

y n fío X fí \ x,i X fí 2 x n X € n 
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Es sencillo escribir este sistema de ecuaciones en la forma y = X(3 + e. Para encontrar X, 
inspeccione las primeras filas del sistema y observe el patrón. 


y i 


1 X) x\ 




ei 

T2 


1 X 2 x\ 


fo) 


<?2 


= 



fo 

+ 


_ yn _ 


_ 1 x n x 2 n _ 


.fo_ 


_ Ú/7 _ 

y 

= 

X 

(i 

+ 

€ 


y EJEMPLO 3 Si los puntos de datos tienden a seguir un patrón como en la figura 5, enton¬ 

ces un modelo adecuado podría ser una ecuación de la forma 

y = fo + fox + fox 2 + fox 3 

Dichos datos podrían ser, por ejemplo, los costos totales de una compañía, como una función 
del nivel de producción. Describa el modelo lineal que da un ajuste de mínimos cuadrados de 
este tipo para los datos (x\, yi),..., ( x„, y„). 

x SOLUCIÓN Mediante un análisis similar al efectuado en el ejemplo 2, se obtiene 



FIGURA 5 

Puntos de datos a lo largo de una 
curva cúbica. 


Vector de 
observaciones 


Matriz de 
diseño 


Vector de Vector 

parámetros residual 


y i 


i 

X\ 

xf 

*r 


'fo¬ 


€\ 

T2 

, x = 

i 

X2 

x\ 

x\ 

, P = 

fo 

, € = 

e 2 







fo¬ 



_y« _ 


_ i 

X n 

A 

4. 


fo 


_ _ 


Regresión múltiple 

Suponga que en un experimento hay dos variables independientes (por ejemplo, u y v) y una 
variable dependiente, y. Una ecuación sencilla para predecir y a partir de u y v tiene la forma 

y = fo + fon + fov (4) 

Una ecuación predictiva más general podría tener la forma 

y = fo + f\u + fov + fou 2 + @4 uv 1 + /? 5 ir (5) 

Esta ecuación se utiliza en geología, por ejemplo, para modelar superficies de erosión, gla¬ 
ciares, el pH del suelo y otras cantidades. En tales casos, el ajuste por mínimos cuadrados se 
llama superficie de tendencia. 

Tanto la ecuación (4) como la (5) conducen a un modelo lineal porque son lineales en 
los parámetros desconocidos (aun cuando u y v están multiplicados). En general, un modelo 
lineal surgirá siempre que y se prediga mediante una ecuación de la forma 

y = fof 0 (u, v) + /3¡fi(u, v) + ■■■ + foffou , v) 

con las funciones conocidas fo,..., fk y los pesos desconocidos fo),..., fo. 

EJEMPLO 4 En geografía, los modelos locales del terreno se construyen mediante los 
datos (ui, vi, yi),.. ., (u n , v n , y„), donde uj, v¡ y y¡ son latitud, longitud y altitud, respectivamen¬ 
te. La solución es el plano de mínimos cuadrados. Véase la figura 6. 
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FIGURA 6 Un plano de mínimos cuadrados. 


SOLUCIÓN Se espera que los datos satisfagan las siguientes ecuaciones 

Ji = Po + Piui + P 2 V 1 + ei 
J 2 = Po + Piu 2 + p 2 v 2 + e 2 


y n ~ Po + P\u n + Piv n + e„ 
Este sistema tiene la forma matricial y = Xp + e, donde 


Vector de 
observaciones 


Matriz de 
diseño 


Vector de Vector 

parámetros residual 


yi 

yi 

, X = 

1 Mi Vi 

1 u 2 V 2 

. p = 

' Po' 
P\ 

, € = 

G 



1 u„ V fI 


Pl 


_^ n _ 


El ejemplo 4 revela que el modelo lineal para regresión múltiple tiene la misma forma 
abstracta que el modelo para regresión simple de los primeros ejemplos. El álgebra lineal nos 
permite entender el principio general subyacente en todos los modelos lineales. Una vez que 
X se define adecuadamente, las ecuaciones normales para ¡8 tienen la misma forma matricial, 
sin importar cuántas variables estén implicadas. Así, para cualquier modelo lineal donde X T X 
sea invertible, el p de mínimos cuadrados está dado por (X'X) l X T y. 


Lecturas adicionales 

Ferguson, J., Introduction to Linear Algebra in Geology (Nueva York: Chapman & Hall, 
1994). 

Krumbein, W. C. y F. A. Graybill, An Introduction to Statistical Moclels in Geology (Nueva 
York: McGraw-Hill, 1965). 

Legendre, P. y L. Legendre, Numerical Ecology (Amsterdam: Elsevier, 1998). 

Unwin, David J., An Introduction to Trend Surface Analysis, Concepts and Techniques in 
Modern Geography, No. 5 (Norwich, Inglaterra: Geo Books, 1975). 

PROBLEMA DE PRÁCTICA 

Cuando las ventas mensuales de un producto están sujetas a las fluctuaciones estacionales, 
entonces una curva que aproxime los datos de venta podría tener la forma 

y = Po + P\X + p 2 sen (2 ttx/ 12) 

donde x es el tiempo en meses. El término Po + P\.x da la tendencia básica de ventas, y el 
término seno refleja los cambios estacionales en las ventas. Determine la matriz de diseño y 
el vector de parámetros para el modelo lineal que conduce a un ajuste de mínimos cuadrados 
de la ecuación anterior. Suponga que los datos son (xu yi),..., (x„, y n ). 
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6.6 EJERCICIOS 

En los ejercicios 1 a 4, encuentre la ecuación y = + ¡3\x de la 

recta de mínimos cuadrados que mejor se ajuste a los puntos de datos 
indicados. 

1. (0, 1), (1, 1), (2, 2), (3, 2) 

2. (1, 0), (2, 1), (4, 2), (5, 3) 

3. (-1), (0,1), (1,2), (2, 4) 

4. (2, 3), (3, 2), (5, 1), (6, 0) 

5. Sea X la matriz de diseño empleada para determinar la rec¬ 
ta de mínimos cuadrados que se ajusta a los datos (x¡, y i),_, 

(x n , y,,)- Utilice un teorema de la sección 6.5 para demostrar 
que las ecuaciones normales tienen solución única si y solo si 
los datos incluyen al menos dos puntos de datos con diferente 
coordenada x. 

6 . Sea X la matriz de diseño del ejemplo 2 correspondiente a un 
ajuste de mínimos cuadrados de los datos (x¡, yi),..., (x,„ y„) 
a una curva parabólica. Suponga que x¡, X 2 y *3 son distintas. 
Explique por qué solo existe una parábola que mejor se ajus¬ 
ta a los datos, en el sentido de mínimos cuadrados. (Véase el 
ejercicio 5). 

7. Un cierto experimento genera los datos (1, 1.8), (2, 2.7), 
(3, 3.4), (4, 3.8), (5, 3.9). Describa el modelo que produce un 
ajuste de mínimos cuadrados de esos puntos mediante una 
función de la forma 

y = Pix + fax 2 

Se podría presentar dicha función, por ejemplo, como el ingreso 
derivado de la venta de x unidades de un producto, cuando la 
cantidad ofrecida para la venta afecta el precio del producto. 

a) Determine la matriz de diseño, el vector de observaciones y 
el vector de parámetros desconocidos. 

b) [M] Encuentre la curva de mínimos cuadrados asociada con 
los datos. 

8 . Una curva sencilla que con frecuencia es un buen modelo para 
los costos variables de una compañía, como una función del ni¬ 
vel x de ventas, tiene la forma y = fi\X + fax 2 + ftx 3 . No existe 
término constante porque no se incluyen los costos fijos. 

a ) Determine la matriz de diseño y el vector de parámetros para 
el modelo lineal que conduce a un ajuste de mínimos cuadra¬ 
dos de la ecuación anterior, con los datos (x¡, yi),..., (x,„ y„). 

b) [M] Encuentre la curva de mínimos cuadrados de la for¬ 
ma anterior para ajustar los datos (4, 1.58), (6, 2.08), (8, 
2.5), (10, 2.8), (12, 3.1), (14, 3.4), (16, 3.8) y (18, 4.32), con 
valores en miles. Si es posible, realice una gráfica que mues¬ 
tre los puntos de datos y la curva de aproximación cúbica. 

9. Un cierto experimento genera los datos (1, 7.9), (2, 5.4) y 
(3, —.9). Describa el modelo que da un ajuste de mínimos cua¬ 
drados de esos puntos mediante una función de la forma 

y = A eos x + B sen x 

10. Suponga que las sustancias radiactivas A y B tienen constantes 
de decaimiento de .02 y .07, respectivamente. Si en el momento 
t = 0 una mezcla de esas dos sustancias contiene Ma gramos de 
A y Mg gramos de B, entonces un modelo para la cantidad total 
y de la mezcla presente en el momento t es 
y = M A e-° 2 ‘ + M B e- 01 ‘ 


Suponga que no se conocen las cantidades iniciales Ma y Aíg, 
pero un científico logra medir las cantidades totales presentes 
en diferentes momentos y registra los siguientes puntos (í¿, y¡): 
(10, 21.34), (11, 20.68), (12, 20.05), (14, 18.87) y (15, 18.30). 

a) Describa un modelo lineal que se pueda utilizar para estimar 
M a y Aí B . 

b) [M] Encuentre la curva de mínimos cuadrados basada en la 
ecuación (6). 



En 1986 fue la última aparición del cometa Halley, el cual rea¬ 
parecerá en el año 2061. 

11. [M] De acuerdo con la segunda ley de Kepler, un cometa de¬ 
bería tener una órbita elíptica, parabólica o hiperbólica (igno¬ 
rando las atracciones gravitacionales de los planetas). En con¬ 
venientes coordenadas polares, la posición ( r , ■&) de un cometa 
satisface una ecuación de la forma 

r = 1 3 + e(r ■ eos 1 ?) 

donde ¡3 es una constante y e es la excentricidad de la órbita, con 
0 Sc<l para una elipse, e = 1 para una parábola, y e > 1 para 
una hipérbola. Suponga que los siguientes datos corresponden a 
las observaciones de un cometa recién descubierto. Determine 
el tipo de la órbita e indique dónde estará el cometa cuando 
■& = 4.6 radianes. 3 



.88 

1.10 

1.42 

1.77 

2.14 

r 

3.00 

2.30 

1.65 

1.25 

1.01 


12. [M] La presión sanguínea sistólica p (en milímetros de mer¬ 
curio) de un niño saludable y su peso w (en libras) están relacio¬ 
nados aproximadamente mediante la ecuación 

Po + Pi ln w = p 

Utilice los siguientes datos experimentales para estimar la 
presión sanguínea sistólica de un niño saludable que pesa 
100 libras. 


3 La idea básica del ajuste de mínimos cuadrados de los datos se debe a 
K. F. Gauss (e, independientemente, a A. Legendre), cuya fama despuntó 
en 1801 cuando utilizó el método para obtener la trayectoria del asteroide 
Ceres. Cuarenta días después de que el asteroide fue descubierto, desapare¬ 
ció detrás del Sol. Gauss predijo que Ceres aparecería 10 meses después y 
precisó su ubicación. La exactitud de la predicción asombró a la comunidad 
científica europea. 
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w 

44 

61 

81 

113 

131 

ln w 

3.78 

4.11 

4.39 

4.73 

4.88 

P 

91 

98 

103 

110 

112 


13. [M] Para medir el desempeño de un avión durante el despegue, 
cada segundo se midió su posición horizontal, deí = 0aí=12. 
Las posiciones (en pies) fueron: 0, 8.8, 29.9, 62.0, 104.7, 159.1, 
222.0, 294.5, 380.4, 471.1, 571.7, 686.8, y 809.2. 

a) Encuentre la curva cúbica de mínimos cuadrados y = /3o + 
/3i t + ¿ 8 2 t 2 + ftí 3 para esos datos. 

tí) Con base en el resultado del inciso a), estime la velocidad 
del avión cuando t = 4.5 segundos. 

14. Sean x = (x\ -\ -1- x„) y y = {y\ -\ -1- y„). De- 

n n 

muestre que la recta de mínimos cuadrados para los datos 
(xi, yi),..., (x„, y„) debe pasar a través de ( x , y). Es decir, de¬ 
muestre que x y y satisfacen la ecuación lineal y = /3o + /3¿x. 
[Sugerencia: Deduzca esta ecuación mediante la ecuación 
vectorial y = X/3 + e. Denote la primera columna de X con 1. 
Con base en el hecho de que el vector residual e es ortogonal 
al espacio columna de X y, por lo tanto, es ortogonal a 1], 

Considerando los datos para un problema de mínimos cuadrados, (xi, 
yi),..., (x„, y„), son útiles las siguientes abreviaciones: 

E* = EU*/. e* 2 = e;u*, 2 . 

E y = E"= 1 y i . E xy = E"= 1 Xi y i 

Las ecuaciones normales para una recta de mínimos cuadrados 
y = /3o + Pix se pueden escribir en la forma 

«/So + Pi E x = El 

(7) 

Po E * + Pi E A ' 2 = E x y 

15. Deduzca las ecuaciones normales (7) a partir de la forma matri- 
cial presentada en esta sección. 

16. Utilice una matriz inversa para resolver el sistema de ecua¬ 
ciones (7) y así obtener las fórmulas para /3o y que aparecen 
en muchos libros de estadística. 


17. a) Rescriba los datos del ejemplo 1 con nuevas coordenadas x 

en la forma de desviación media. Sea X la matriz de diseño 
asociada. ¿Por qué son ortogonales las columnas de X? 
b) Escriba las ecuaciones normales para los datos del inciso a), 
y resuélvalas para encontrar la recta de mínimos cuadrados, 
y = /3o + Pix*. donde x* = x - 5.5. 

18. Suponga que las coordenadas x de los datos (xi, yi),..., (x„, y„) 
están en la forma de desviación media, así que Yxi = 0. De¬ 
muestre que si X es la matriz de diseño para la recta de mínimos 
cuadrados de este caso, entonces XJX es una matriz diagonal. 

Los ejercicios 19 y 20 implican a una matriz de diseño X con dos o 
más columnas y una solución de mínimos cuadrados ¿8 de y = X/3. 
Considere los siguientes números. 

i. ||X¿8|| 2 , la suma de los cuadrados del "término de regresión”. 
Denote este número con SS(R). 

ii. ||y — X/3|| 2 , la suma de los cuadrados para el término de 
error. Denote este número con SS(E). 

>ü- lly|| 2 > la suma "total” de los cuadrados de los valores y. 
Denote este número con SS(T). 

Todos los libros de estadística analizan el tema de la regresión, y el 
modelo lineal y = X/3 + e introduce esos números, aunque la nota¬ 
ción y la terminología tal vez varíen de un texto a otro. Para simplifi¬ 
car el asunto, suponga que la media de los valores y es cero. En este 
caso, SS(T) es proporcional a la varianza del conjunto de valores y. 

19. Justifique la ecuación SS(T) = SS(R) + SS(E). [Sugerencia: 
Utilice un teorema, y explique por qué se satisfacen las hipótesis 
del teorema]. Esta ecuación es extremadamente importante en 
estadística, en la teoría de regresión y en el análisis de varian¬ 
za. 

20. Demuestre que \\X¡3\\ 2 = ¿8 r X T y. [Sugerencia: Rescriba el lado 
izquierdo y considere el hecho de que ¿8 satisface las ecuaciones 
normales]. Esta fórmula para SS(R) se emplea en estadística. 
Con base en esto y en el ejercicio 19, obtenga la fórmula están¬ 
dar para SS(E): 

SS(E) = y r y -p T X T y 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 


Construya X y /3 tal que la Césima fila de Xf3 sea el valor de y predicho correspondiente al 
punto de datos (x¿, y¿), a saber. 


/3o + Pix k + /3 2 sen (2tt x k / 12) 


Debería ser claro que 


Tendencia de ventas con 
fluctuaciones estacionales. 


- X 

X = 

■ 1 

x\ sen(2jrxi/12) 

. P = 

'/So' 

/3, 



1 

x n sen(2jrx„/12) 


/3 2 
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6.7 


ESPACIOS CON PRODUCTO INTERIOR 


Los conceptos de longitud, distancia y ortogonalidad son esenciales en aplicaciones que im¬ 
plican un espacio vectorial. Para IR", esos conceptos se basaron en las propiedades del pro¬ 
ducto interior indicadas en el teorema 1 de la sección 6.1. Para otros espacios, se necesitan 
analogías del producto interior con las mismas propiedades. Ahora las conclusiones del teo¬ 
rema 1 se convierten en axiomas en la siguiente definición. 


DEFINICION Un producto interior sobre un espacio vectorial V es una función que asocia un núme¬ 
ro real (u, v) para cada par de vectores u y v en V, y satisface los siguientes axiomas, 
para toda u, v, w en V, y todos los escalares c: 

1. (u, v) = (v, u) 

2. (u + v, w) = (u, w) + (v, w) 

3. (cu, v) = c(u, v) 

4. (u, u) & 0 y (u, u) = 0 si y solo si u = 0 

Un espacio vectorial con un producto interior se llama espacio con producto interior. 


El espacio vectorial R n con el producto interior estándar es un espacio con producto 
interior, y casi todo lo analizado en este capítulo para R" también es válido para los espacios 
con producto interior. Los ejemplos en esta sección y la siguiente establecen el fundamento 
para una variedad de aplicaciones que se estudian en cursos de ingeniería, física, matemáticas 
y estadística. 

EJEMPLO 1 Elija dos números positivos cualesquiera, por ejemplo, 4 y 5; para los 
vectores u = (tq, tq) y v = (vi, vi) en R 2 , establezca 

(U, V) = 4miUi + 5u 2 V2 Q) 


Demuestre que la ecuación (1) define un producto interior. 

SOLUCION Sin duda, el axioma 1 se satisface, porque (u, v) = Au\V\ + 5uoV2 = 4ui«i + 
5 u2«2 = (v, u). Si w = (wi, W 2 ), entonces, 

(u + V, w) = 4 (Mi + V\)W\ + 5(l<2 + V2)Ul2 

= 4u\U)\ + 5U2U¡2 + 4v\W\ + 5V2W2 
= (u, w) + (v, w) 

Esto comprueba el axioma 2. Para el axioma 3, calcule 

(cu,v) = 4(CMi)Ui + 5(cil2)V2 = c(4uiUi + SU 2 V 2 ) = c(u, v) 

Para el axioma 4, observe que (u, u) = 4« 2 + 5w 2 > 0 y 4u\ 4- 5« 2 = 0 solo si U\ = «2 = 0, 
es decir, si u = 0. Además, (0, 0) = 0. Así, (1) define un producto interior sobre R 2 . ■ 

Sobre R" se pueden definir productos interiores similares a (1), que surgen naturalmente 
en problemas de “mínimos cuadrados ponderados”, en los cuales los pesos se asignan a las 
diversas entradas en la suma para el producto interior de manera que se dé mayor importancia 
a las mediciones más confiables. 

De ahora en adelante, cuando un espacio con producto interior implique polinomios u 
otras funciones, se escribirán las funciones en la forma usual, en vez de emplear negritas para 
los vectores. Sin duda, es importante recordar que cada función es un vector cuando se trata 
como un elemento de un espacio vectorial. 
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EJEMPLO 2 Sean to,..., t n números reales distintos. Para p y q en P„, defina 

ÍP,q) = P(t 0 )q(t 0 ) + p(ti)q(ti) H-f p(t n )q(t„) (2) 

Es sencillo comprobar los axiomas 1 a 3 del producto interior. Para el axioma 4, observe que 

ÍP’P) = ÍP(to)] 2 + [p(h)] 2 + ••• + [p(t„)] 2 > 0 

Además, (0, 0) = 0. (Aquí el cero en “negritas” denota el polinomio cero, el vector cero en 
P„). Si ( p, p) = 0, entonces p se debe anular en n + 1 puntos: to,..., t„. Esto solo es posible 
si p es el polinomio cero, porque el grado de p es menor que n + 1. Así, (2) define un pro¬ 
ducto interior en P„. ■ 

EJEMPLO 3 Considere que V está en P 2 , con el producto interior del ejemplo 2, donde 
ío = 0, ti = \, y t 2 = 1. Sean p(t) = 12í 2 y q(t) = 2t — 1. Calcule (p, q ) y (q, q). 

SOLUCIÓN 

{p.q) = p(0)q(0) + p{\)q{\) + p( 1)<?(1) 

= (0)(—1) + (3) (0) + (12)(1) = 12 

(q,q) = [qm 2 + lq&] 2 + [qW] 2 

= (-1) 2 + (O) 2 + (l) 2 = 2 ■ 

Longitudes, distancias y ortogonalidad 

Sea V un espacio con producto interior, con el producto interior denotado con (u, v). Igual que 
en R", defina la longitud, o norma, de un vector v como el escalar 

||v|| = (v, v) 

De manera equivalente, ||v|| 2 = (v, v). (Esta definición tiene sentido porque (v, v) s 0, 
pero la definición no dice que (y, v) sea una “suma de cuadrados” porque v no necesita ser 
un elemento de R"). 

Un vector unitario es aquel cuya longitud es 1. La distancia entre u y v es ||u — v||. 
Los vectores u y v son ortogonales si (u, v) = 0. 

EJEMPLO 4 Suponga que P 2 tiene el producto interior (2) del ejemplo 3. Calcule las 
longitudes de los vectores p(t) = 12í 2 y q{t) = 21 — 1. 

SOLUCIÓN 

\\p\\ 2 = (p,p) = [pm 2 + \pü)T + [pW} 2 
= 0+ [3] 2 + [12] 2 = 153 

MI = VI53 

Del ejemplo 3, (q, q) = 2. Por lo tanto, ||^|| = \Í2. ■ 


Proceso de Gram-Schmidt 

La existencia de bases ortogonales para subespacios de dimensión finita de un espacio vec¬ 
torial con producto interior se puede establecer con el proceso de Gram-Schmidt, al igual 
que en R". Mediante este proceso, es posible construir ciertas bases ortogonales que surgen a 
menudo en las aplicaciones. 

La proyección ortogonal de un vector sobre un subespacio W con una base ortogonal se 
puede construir en la forma habitual. La proyección no depende de la base ortogonal selec¬ 
cionada, y tiene las propiedades descritas en los teoremas de descomposición ortogonal y de 
la mejor aproximación. 
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EJEMPLO 5 Considere que V está en P 4 con el producto interior del ejemplo 2, lo que 
implica evaluación de polinomios en —2, — 1, 0, 1 y 2, y que PS es un subespacio de V. Obtenga 
una base ortogonal para P 2 aplicando el proceso de Gram-Schmidt a los polinomios 1, t y í 2 . 

SOLUCIÓN El producto interior sólo depende de los valores de un polinomio en —2,..., 2, 
así que se listan los valores de cada polinomio como un vector en K 5 , debajo del nombre de 
cada polinomio : 1 


Polinomio: 

1 

t 

r 2 


T 


~-2~ 


"4" 


1 


-1 


1 

Vector de valores: 

1 


0 


0 


1 


1 


1 


1 


2 


4 


El producto interior de dos polinomios en V es igual al producto interior (estándar) de sus 
vectores correspondientes en Observe que t es ortogonal a la función constante 1. Así, 
se toman po(t) = 1 y pi(t) = t. Para pi, utilice los vectores en IR 5 para calcular la proyección 
de t 2 sobre Gen {/? q , Pi }: 


(Po, Po) = 5 

(f 2 , p\) = (f 2 , t) = —8 + (— 1 ) + 0 + l + 8 = 0 


La proyección ortogonal de t ¿ sobre Gen {1, t} es 4* pa + 0 p\. Por consiguiente, 


p 2 (t ) = t 2 - 2p 0 (t) = t 2 -2 
Una base ortogonal para el subespacio P 2 de V es: 


Polinomio: 

Po 

pi 

P2 


T 


”- 2 ' 


2 " 


1 


-1 


-1 

Vector de valores: 

1 

, 

0 

, 

-2 


1 


1 


-1 


1 


2 


2 


(3) 


Mejor aproximación en espacios con producto interior 

Un problema común en matemáticas aplicadas implica un espacio vectorial V cuyos elemen¬ 
tos son funciones. El problema es aproximar una función/en V mediante una función g de un 
subespacio especificado W de V. La “cercanía” de la aproximación de/depende de la manera 
en que se defina ||/ — g||. Solo se considerará el caso en que la distancia entre / y g esté de¬ 
terminada por un producto interior. En tal caso, la mejor aproximación a f mediante funciones 
en W es la proyección ortogonal de/sobre el subespacio W. 

EJEMPLO 6 Considere que V está en P 4 con el producto interior del ejemplo 5; consi¬ 
dere también que po, p¡ y P 2 constituyen la base ortogonal que se encontró en el ejemplo 5 
para el subespacio PV Determine la mejor aproximación a p(t) = 5 — df 4 mediante poli¬ 
nomios en PA 


1 Cada polinomio en P 4 está determinado de manera unívoca por su valor en los cinco números —2,.... 2. De hecho, 
la correspondencia entre p y su vector de valores es un isomorfismo, es decir, un mapeo uno a uno sobre R 5 que 
preserva combinaciones lineales. 
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SOLUCIÓN Los valores de po, p\ y p 2 en los números — 2, — 1, 0, 1 y 2 están listados en 
los vectores de IR 5 en (3). Los valores correspondientes para p son —3, 9/2, 5, 9/2 y —3. 
Calcule 


{p, po) = 8 , (p, p i) = 0, {p, p 2 ) = -31 

{po.po)=5, (p 2 ,p 2 ) = 14 


Así, la mejor aproximación en V a p mediante polinomios en PS es 


P =W°yp 2 P 


ÍP'Po) 
{po . Po) 


Po + 


{p-p l) 
(PuPl) 


p 1 + 


(p, Pl) 
iP2,Pl) 


Pl 


o i —31 „ _ o 31 (t 2 y* 

7P0 + -r rP2 — C - TaV - 2). 


De todos los polinomios en PP, este es el más cercano a p cuando la distancia entre polino¬ 
mios se mide solo en —2, —1,0, 1 y 2. Véase la figura 1. ■ 



FIGURA 1 


Los polinomios po, p\ y p 2 de los ejemplos 5 y 6 pertenecen a una clase de polinomios 
que en estadística se denominan polinomios ortogonales . 2 La ortogonalidad se refiere al tipo 
de producto interior descrito en el ejemplo 2 . 


Dos desigualdades 

Considerando un vector v en un espacio V con producto interior y dado un subespacio W de 
dimensión finita, se aplica el teorema de Pitágoras a la descomposición ortogonal de v con 
respecto a W y se obtiene 

|M | 2 = ||proyw v || 2 + ||v — proyvr v || 2 

Véase la figura 2. En particular, esto muestra que la norma de la proyección de v sobre W 
no excede la propia norma de v. Esta sencilla observación conduce a la siguiente importante 
desigualdad. 


TEOREMA 16 

Desigualdad de Cauchy-Schwarz 



Para toda u y v en V, 



(u, v)| ^ |u | ||v | 

(4) 


Ilvll 


Hv~proy v|| 


W 


llproy^vll 


pr°yH/ v 


FIGURA 2 

La hipotenusa es el lado 
más largo. 


2 Véase Statistics and Experimental Design in Engineeríng and the Physical Sciences, 2a. ed., de Norman L. Johnson 
y Fred C. Leone (Nueva York: John Wiley & Sons, 1977). En este libro las tablas listan los “polinomios ortogonales”, 
que son simplemente los valores de los polinomios en números como —2, — 1. 0, 1 y 2. 
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DEMOSTRACION Si u = 0, entonces ambos lados de (4) son iguales a cero, por lo tanto, la 
desigualdad es verdadera en este caso. (Véase el problema de práctica 1). Si u ¥= 0, sea W el 
subespacio generado por u. Recuerde que ||cu|| = |c| ||u|| para cualquier escalar c. Así, 


llproyiv v| 


(v.u) 
(u. u) ' 


I (v, U> I | <V, u) I „ | (u, v) I 

17—= i, na IMI = i, i, 
|( u ,u)| ||u|| z ||u || 


.. . | (u, v) I 

Puesto que ||proyw v|| < ||v||, se tiene —-—-— < || v||, lo que da la ecuación (4). 


La desigualdad de Cauchy-Schwarz es útil en muchas ramas de las matemáticas. En los 
ejercicios se presentan unas cuantas aplicaciones. Esta desigualdad es necesaria para probar 
otra desigualdad fundamental que implica normas de vectores. Véase la figura 3. 


TEOREMA 17 


Desigualdad del triángulo 
Para toda u y v en V, 

llu + v|| ^ llull + ||v| 


DEMOSTRACIÓN 


v u + v 

llu + vil 

/llvll 

0 llull u 

FIGURA 3 

Las longitudes de los lados 
de un triángulo. 


|| u + v || 2 = (u + v, u + v) = (u, u) + 2(u, v) + (v, v) 

< ||u|| 2 + 2|(u,v)| + ||v|| 2 

< ||u|| 2 + 2||u|| ||v|| + ||v|| 2 Cauchy-Schwarz 

= (llull + llvll) 2 

La desigualdad del triángulo se deduce inmediatamente al sacar la raíz cuadrada en ambos 
lados. ■ 


Un producto interior para C[a, b ] (se requiere cálculo) 

Quizás el espacio con producto interior más ampliamente utilizado en aplicaciones sea el 
espacio vectorial C[a, b] de todas las funciones continuas en un intervalo a < í < b, con 
un producto interior que enseguida se describirá. 

Se inicia considerando un polinomio p y cualquier entero n mayor o igual que el grado 
de p. Entonces p está en P,„ y se puede calcular una “longitud” para p utilizando el produc¬ 
to interior del ejemplo 2 que implica evaluación en n + 1 puntos en |«, b]. Sin embargo, esta 
longitud de p solo capta el comportamiento en esos n + 1 puntos. Como p está en P„ para 
todas las n grandes, se podría utilizar un valor de n bastante grande, con mucho más puntos 
para la “evaluación” asociada con el producto interior. Véase la figura 4. 


I I 
I I 
I I 
J_L 


p(t) 

A 




I I 


I I 
I I 
_I_L 


I I 
I I 
I I 
_I_L 


_I_L 


Mili 
M I I i 
VLX 


p(t) 

A 

_l_l 


t 


b 


FIGURA 4 Uso de diferentes números de puntos de evaluación en [a, b] para 
calcular \\p\\ 2 . 
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Se particiona [a, b] en n + 1 subintervalos de longitud A t = (b — á)/(n + 1), y sean 
id,.. t„ puntos arbitrarios en esos subintervalos. 

—H A t k— 


a t 0 tj t n b 

Si n es grande, el producto interior sobre P„ determinado por íq,..., t n tenderá a dar un gran 
valor para (p, p ), así que se reduce a escala y se divide entre n + 1. Observe que I /(n + 1) 
= Ai/ (b — a), y se define 


ip-q) 


1 " 

ut Z 


n + 1 


j=o 


b — a 


J2p(t j )q(t j )A t 

j =o 


Ahora, n crece sin límite. Puesto que los polinomios p y q son funciones continuas, entonces 
la expresión entre corchetes es una suma de Riemann que se aproxima a una integral definida, 
lo que conduce a considerar el valor promedio de p(t)q(t ) sobre el intervalo [a, /;]: 

1 r b 

- - / p(t)q(t)dt 

b-a J a 


Esta cantidad está definida para polinomios de cualquier grado (de hecho, para todas las 
funciones continuas), y tiene todas las propiedades de un producto interior, como lo muestra 
el siguiente ejemplo. El factor de escala 1 /(b — a) no es esencial y con frecuencia se omite 
con la finalidad de simplificar. 

EJEMPLO 7 Para/, g en C[a, £>], sea 

(f g) = í f(t)g{t) di (5) 

Ja 

Demuestre que la ecuación (5) define un producto interior sobre C[a, b], 

SOLUCIÓN Los axiomas 1 a 3 del producto interior se deducen de las propiedades elemen¬ 
tales de las integrales definidas. Para el axioma 4, observe que 

(/,/>= f b [f(t)] 2 dt> 0 

J a 

La función [/(í )] 2 es continua y no negativa en [ a , b]. Si la integral definida de [/(f )] 2 es 
cero, entonces [ f(t)] 2 debe ser idénticamente cero sobre [a, b ], de acuerdo con un teorema 
en cálculo avanzado; en tal caso,/es la función cero. Así (f f) = 0 implica que/es la fun¬ 
ción cero en [a, b]. Por lo tanto, (5) define un producto interior sobre C[a, b}. ■ 


EJEMPLO 8 Sean V el espacio C[0, 1] con el producto interior del ejemplo 7, y W el 
subespacio generado por los polinomios p\(t) = 1, pi(r) = 2r — 1 y pdt) = 12 1 2 . Utilice 
el proceso de Gram-Schmidt y encuentre una base ortogonal para W. 

SOLUCIÓN Sea q\ = p\, y calcule 


(P2,qi) 


f 


(2 1 — 1)(1) dt = (t 2 — t ) 


o 
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De manera que pz ya es ortogonal a q\, y se puede tomar qi = pi- Para la proyección de P 3 
sobre W 2 = Gen [q\, qi ¡. se calcula 


Entonces 


(P3,qi) = 

f \2t 2 -\dt - 

= 41 3 = 


Jo 

í ^ 

0 

1 

(quqi) = 

/ 1*1 dt = t 

= 1 


Jo 

0 

(723,42) = 

f 12 ? 2 ( 2 ? - 1 )dt = I 


Jo 

j 1 

(42,42) = 

í (21 — l ) 2 dt 
Jo 

= ~ 6 12 ' 


(P3,qi) ( 773 , 42 ) 4 2 

proy w 2 P 3 = 7-r 4 i + 7-r 4 2 = t 4 i + 77742 = * q \ + 6 q 2 

(41,41) (42,42) i i /3 

<73 = P 3 - proy 117773 = P 3 - 4<7i - 6í/2 


Como una función, ^3 (í) = 12f 2 — 4 — 6(2? — 1) = 12f 2 — 12? + 2. La base ortogonal para 
el subespacio W es {q\, qi, ¿ 73 }. ■ 


PROBLEMAS DE PRÁCTICA 

Aplique los axiomas del producto interior para comprobar los siguientes enunciados. 

1 . (v, 0 ) = ( 0 , v) = 0 . 

2 . (u, v + w) = (u, v) + (u, w). 


6.7 EJERCICIOS 

1. Suponga que R 2 tiene el producto interior del ejemplo 1, y sean 
x = (1, l)yy = (5, -1). 

a) Encuentre ||x||, ||y|| y |(x, y)| 2 . 

b) Describa todos los vectores (z.\, Za) que son ortogonales a y. 

2. Considere que R 2 tiene el producto interior del ejemplo 1. De¬ 
muestre que la desigualdad de Cauchy-Schwarz es válida para 
x = (3, —2) y y = (—2, 1). (Sugerencia: Estudie |(x, y)| 2 ). 

Los ejercicios 3 a 8 se refieren a P 2 con el producto interior dado por 
evaluación en — 1 , 0 y 1 . (Véase el ejemplo 2). 

3 . Calcule (p, q), donde p(t) =4 + t, q(t) = 5 — 41 2 . 

4 . Calcule (p, q), donde p(t) = 31 — t 2 , q(t) = 3 + 21 2 . 

5. Obtenga ||p|| y ||p||, para p y q del ejercicio 3. 

6 . Obtenga ||p|| y ||<?||, para p y q del ejercicio 4. 

7. Determine la proyección ortogonal de q sobre el subespacio 
generado por p, para p y q en el ejercicio 3. 

8 . Obtenga la proyección ortogonal de q sobre el subespacio ge¬ 
nerado por p, para p y q en el ejercicio 4. 


9. Considere que P 3 tiene el producto interior dado por evaluación 
en —3, — 1, 1 y 3. Sean p 0 (t) = 1, p\(t) = t y pn(t) = í 2 . 

a) Calcule la proyección ortogonal de P 2 sobre el subespacio 
generado por po y p¡. 

b) Encuentre un polinomio q que sea ortogonal a po y p 1 , tal 
que [po,pi,q] sea una base ortogonal para Gen {po,pi,pi}- 
Escale el polinomio q de modo que su vector de valores en 
(-3, -1, 1, 3) sea (1, -1,-1, 1). 

10. Considere que P 3 tiene el producto interior del ejercicio 9, 
con los polinomios po, p\ y q ahí descritos. Determine la 
mejor aproximación a p(t) = í 3 mediante polinomios en 
Gen [po,p\, q\. 

11. Suponga que po, p\ y P 2 son los polinomios ortogonales des¬ 
critos en el ejemplo 5, donde el producto interior sobre P 4 está 
dado por evaluación en —2, — 1, 0, 1 y 2. Encuentre la pro¬ 
yección ortogonal de t 3 sobre Gen {po, pi, P 2 }■ 

12. Obtenga un polinomio P 3 tal que {po, pu P 2 , P 2 } (véase el ejer¬ 
cicio 11) sea una base ortogonal para el subespacio P3 de P4. 
Escale el polinomio ps de manera que su vector de valores sea 
(-1,2, 0, -2, 1). 
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13. Sea A una matriz invertible de n x n. Demuestre que para u, v 
en IR", la fórmula (u, v) = (Au)- (Av) = (Au) r (Av) define un 
producto interior sobre IR". 

14. Sea T una transformación lineal uno a uno de un espacio 
vectorial V en IR". Demuestre que para u, v en V , la fórmula 
(u. v) = Hu) • T( v) define un producto interior sobre V. 

Utilice los axiomas del producto interior y otros resultados de esta 

sección para comprobar los enunciados de los ejercicios 15 a 18. 

15. (u. c\) = c(u. v) para todos los escalares c. 

16. Si {u, v¡ es un conjunto ortonormal en V, entonces 
II u v|| = V2 


17. (u,v) = > + v|| 2 ->-v|| 2 

18. ||u + v|| 2 + ||u — v|| 2 = 2||u|| 2 + 2||v|| 2 


19. 


20 . 


Dados a 


0 y b S 0, sean u = 


" s/o " 

1 .. _ 

rv¿i 

s/b 

*< 

•< 

II 

_1 


Aplique la desigualdad de Cauchy-Schwarz para comparar la 
media geométrica \íab con la media aritmética (a + b)/2. 


Sean u = 


y V: 


Utilice la desigualdad de 


Cauchy-Schwarz para demostrar que 


m' 


+b 2 


Los ejercicios 21 a 24 se refieren a V = C[0, 1], con el producto 

interior dado por una integral, como en el ejemplo 7. 

21. Calcule (/, g }. donde f(t) = 1 — 3f 2 y g(t) — t — t 3 . 

22. Determine (/, g), donde f(t) = 5t — 3 y g(f) = t 3 — t 2 . 

23. Obtenga ||/|| para la/del ejercicio 21. 

24. Calcule ||g|| para la g del ejercicio 22. 

25. Sea V el espacio C[— 1, 1] con el producto interior del ejemplo 
7. Encuentre una base ortogonal para el subespacio generado 
por los polinomios 1, í y í 2 . Los polinomios en esta base se 
llaman polinomios de Legendre. 

26. Sea V el espacio C[—2, 2] con el producto interior del ejemplo 
7. Obtenga una base ortogonal para el subespacio generado por 
los polinomios 1, t y t 2 . 

27. [M] Considere que P4 tiene el producto interior como en el 
ejemplo 5, y sean po, p\, pi los polinomios ortogonales de ese 
ejemplo. Con su programa de matrices, aplique el proceso de 
Gram-Schmidt al conjunto {po, p 1, P 2 , f 3 , f 4 ) y cree una base 
ortogonal para P 4 . 

28. [M] Sea V el espacio C[0,2i7] con el producto interior del ejem¬ 
plo 7. Aplique el proceso de Gram-Schmidt con la finalidad 
de crear una base ortogonal para el subespacio generado por 
{1, cosí, cos 2 r, cos 3 f}. Utilice un programa de matrices o 
computacional para calcular las integrales definidas adecuadas. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Por el axioma 1, (v, 0) = (0,v). Entonces (0, v) = (Ov, v) = 0(v, v), por el axioma 3, 
de manera que (0, v) = 0. 

2. Por los axiomas 1 y 2, y después 1 otra vez, (u, v + w) = (v + w, u) = (v, u) + (w, u) = 
(u, v) + (u, w). 


6.8J APLICACIONES DE ESPACIOS CON PRODUCTO INTERIOR 

Los ejemplos de esta sección ilustran cómo surgen en problemas prácticos los espacios con 
producto interior definidos en la sección 6.7. El primer ejemplo se relaciona con el inmenso 
problema de mínimos cuadrados de actualización del North American Datum, descrito en el 
ejemplo introductorio de este capítulo. 

Mínimos cuadrados ponderados 

Sea y un vector de n observaciones, yi,..., y„, y suponga que se desea aproximar y median¬ 
te un vector y que pertenece a determinado subespacio de IR". (En la sección 6.5, y se escri¬ 
bió como Ax, de manera que y estuviera en el espacio columna de A). Denote las entradas 
en y como y 1 y n - Entonces la suma de los cuadrados de los errores, o SS(E), al aproximar 
y por y es 

SS(E) = (y, - vj) 2 + •••+(*,- y n f (1) 

Esto es simplemente ||y — y|| 2 , utilizando la longitud estándar en R". 
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Ahora suponga que las mediciones que generaron las entradas en y no son igualmente 
confiables. (Este fue el caso para el North American Datum, porque las mediciones se realiza¬ 
ron durante un periodo de 140 años). Como otro ejemplo, las entradas en y se podrían calcular 
a partir de varias muestras de medidas, con tamaños de muestra desiguales). Entonces, resulta 
adecuado ponderar los errores cuadráticos de la ecuación (1) de tal manera que se dé mayor 
importancia a las mediciones más confiables. 1 Si los pesos se denotan como w 2 . w 2 , en¬ 

tonces la suma ponderada de los errores cuadráticos es 

SS(E) ponderada = tn 2 (jq - Vi) 2 +-f w 2 (y„ - y„) 2 (2) 

Este es el cuadrado de la longitud de y — y, donde la longitud se deduce a partir de un pro¬ 
ducto interior análogo al del ejemplo 1 de la sección 6.7, a saber, 


(x,y) = wjxiyi + -b w 2 x„y„ 


Algunas veces es conveniente transformar un problema de mínimos cuadrados pondera¬ 
dos en un problema equivalente de mínimos cuadrados ordinario. Sea W la matriz diagonal 
con wiw„ (positivos) en su diagonal, de manera que 
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_i 




myi 

0 w 2 


yi 
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w 2 y2 
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K 
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con una expresión similar para Wy. Observe que el y-ésimo término en la ecuación (2) se 
puede escribir como 


wfoj ~ y i ) 2 = (wjyj - WjVj ) 2 


Se deduce que la SS(E) ponderada en la ecuación (2) es el cuadrado de la longitud ordinaria 
en IR" de Wy — Wy, que se puede representar en la forma ||VKy — Wy|| 2 . 

Ahora suponga que el vector de aproximación y se construirá mediante las columnas 
de A. Entonces se busca una x que haga que Ax = y esté tan cerca de y como sea posible. 
Sin embargo, la medida de cercanía es el error ponderado, 

\\Wy- Wyf = \\Wy- WAítf 

Así, x es la solución (ordinaria) de mínimos cuadrados de la ecuación 

WAx = Wy 

La ecuación normal para la solución de mínimos cuadrados es 


(WAYWAx = (WA) T Wy 


EJEMPLO 1 Encuentre la recta de mínimos cuadrados y = ¡3o + ¡i\x que mejor se ajuste 
a los datos (—2, 3), (—1, 5), (0, 5), (1, 4) y (2, 3). Suponga que los errores al medir los valores 
y de los dos últimos puntos de datos son más grandes que para los demás puntos. Pondere 
estos datos a la mitad en relación con los datos restantes. 


1 Nota para lectores con conocimientos de estadística: Suponga que los errores al medir y, son variables aleatorias 

independientes con media igual a cero y varianzas of.<T,j. Entonces, los pesos adecuados en la ecuación (2) son 

wf = l/af. Cuanto mayor sea la varianza del error, menor será el peso. 
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SOLUCION Como en la sección 6.6, escriba X para la matriz A y /3 para el vector x, y 
obtenga 
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Para una matriz de ponderación, seleccione W con entradas diagonales 2, 2, 2, 1 y 1. Al mul¬ 
tiplicar por la izquierda por W se escalan las filas de A y y: 


"2 -4" 


6" 

2 -2 


10 

2 0 

II 

10 

1 1 


4 

1 2 
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Para la ecuación normal, calcule 


(WX) T WX 


14 

-9 


-9 

25 


y {WX) T Wy 


59 

-34 


y 



v = 4.3 + ,2x 

• -< 

' _ J. ___- 

2- 

y = 4-.lx 

-2 

2 

FIGURA 1 



X 


Rectas de mínimos cuadrados 
ordinaria y ponderada. 


y resuelva 
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La solución de la ecuación normal es (a dos dígitos significativos) fío = 4.3 y fí\ = .20. La rec¬ 
ta deseada es 


y = 4.3 + .20,y 

En contraste, la recta de mínimos cuadrados ordinaria para estos datos es 

y = 4.0 — .10jc 

En la figura 1 se representan ambas rectas. ■ 


Análisis de tendencia de datos 

Sea / una función desconocida cuyos valores se conocen (quizá solo aproximadamente) en 
to,..., t„. Si existe una “tendencia lineal” en los datos f(to),..., /(í„), entonces se espera po¬ 
der aproximar los valores de/mediante una función de la forma fío + ¡i\t. Si hay una “tenden¬ 
cia cuadrática” de los datos, podría intentarse una función con la estructura fío + fíit + fíat 2 . 
Esto se analizó en la sección 6.6, pero desde otro punto de vista. 

En algunos problemas estadísticos, es importante poder separar las tendencias lineal y 
cuadrática (y posiblemente cúbica o de mayor orden). Por ejemplo, suponga que unos inge¬ 
nieros están analizando el desempeño de un nuevo automóvil, y f(t) representa la distancia 
entre el vehículo (en el momento í) y algún punto de referencia. Si el auto viaja a velocidad 
constante, entonces la gráfica de f{t) debería ser una recta cuya pendiente es la velocidad del 
auto. Si se presiona el acelerador repentinamente, entonces la gráfica de f(t) cambiará para in¬ 
cluir un término cuadrático y posiblemente un término cúbico (debido a la aceleración). Para 
analizar la capacidad del auto para rebasar a otro, por ejemplo, los ingenieros tal vez quieran 
separar las componentes cuadrática y cúbica del término lineal. 

Si la función es aproximada por una curva de la forma y = fío + fí^t + fíat 2 , es posi¬ 
ble que el coeficiente fí 2 no brinde la información deseada sobre la tendencia cuadrática en 
los datos, porque quizá no sea “independiente” (en un sentido estadístico) de los otros /3,-. 
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y 

--\y=p(í) 


2 -- 

-1-1-1-1-1-H-v 

-2 2 

FIGURA 2 

Aproximación por una función 
de tendencia cuadrática. 


Para efectuar el análisis de tendencia de los datos, se introduce un producto interior sobre el 
espacio P„ análogo al del ejemplo 2 de la sección 6.7. Para p, q en P„, se define 

(p,q) = p(to)q(to) H-b p(t n )q(t n ) 

En la práctica, los especialistas en estadística rara vez necesitan considerar tendencias en 
los datos de grado mayor a tres o cuatro. Así que sean /y,. p¡, p 2 , pj una base ortogonal del 
subespacio P3 de P,„ obtenida al aplicar el proceso de Gram-Schmidt a los polinomios 1, t, 
t 2 y f 3 . De acuerdo con el ejercicio complementario 11 del capítulo 2, existe un polinomio g 
en P„ cuyos valores en ., t n coinciden con aquellos de la función desconocida /. Sea g la 
proyección ortogonal (con respecto al producto interior dado) de g sobre P 3 , digamos, 

g = c 0 po + cipi + c 2 p 2 + C2P2 

Entonces g se llama una función de tendencia cúbica, y co,..., C 3 son los coeficientes de 
tendencia de los datos. El coeficiente c 1 mide la tendencia lineal, c 2 la tendencia cuadrática, 
y C 3 la tendencia cúbica. Resulta que si los datos tienen ciertas propiedades, entonces esos 
coeficientes son estadísticamente independientes. 

Como po,..., pi son ortogonales, los coeficientes de tendencia se pueden calcular uno 
por uno, independientemente de los otros. (Recuerde que c,- = {g. p¡)/{p ¡, p¡)). Es posible 
ignorar p 2 y c 3 si solo se desea la tendencia cuadrática. Y si, por ejemplo, se necesita deter¬ 
minar la tendencia cuártica, solo se tendría que encontrar (por medio de Gram-Schmidt) un 
polinomio p4 en P4 ortogonal a P3 y calcular (g, pn) /(/>4, p¡{). 

EJEMPLO 2 El uso más sencillo y común del análisis de tendencia ocurre cuando los 
puntos ío,..., í„ se pueden ajustar para quedar equidistantes entre sí y su suma sea cero. Ajuste 
una función de tendencia cuadrática a los datos (—2, 3), (—1, 5), (0, 5), (1, 4) y (2, 3). 

SOLUCION Las coordenadas t se escalan convenientemente para emplear los polinomios 
ortogonales encontrados en el ejemplo 5 de la sección 6.7: 


Polinomio: 

Po 

P 1 

P2 

Datos: 


1 


~-2“ 


2“ 


"3" 


1 


-1 


-1 


5 

Vector de valores: 

1 


0 


-2 


5 


1 


1 


-1 


4 


1 


2 


2 


3 


Los cálculos solo necesitan esos vectores, y no las fórmulas específicas para los polinomios or¬ 
togonales. La mejor aproximación a los datos mediante polinomios en P 2 es la proyección 
ortogonal dada por 


ig,Po) , (g,P 1 ) , (g-Pl) 

{Po-Po) iPuPi) {P2,P2) 

_ 20 n 1 _ 7 „ 

- T P° ~ T óP' ~ Ti P- 

y 

p(t) = 4- At - .5(r 2 — 2) (3) 

Como el coeficiente de P 2 no es extremadamente pequeño, sería razonable concluir que la 
tendencia es al menos cuadrática. Esto se confirma con la gráfica de la figura 2. ■ 



6.8 Aplicaciones de espacios con producto interior 387 


Serie de Fourier (se requiere cálculo) 


Con frecuencia, las funciones continuas se aproximan mediante combinaciones lineales de 
funciones seno y coseno. Por ejemplo, una función continua podría representar una onda so¬ 
nora, una señal eléctrica del algún tipo, o el movimiento de un sistema mecánico vibratorio. 

Para simplificar, considere funciones en 0 < t < 277. Resulta que cualquier función en 
C[0, 27 t] se puede aproximar tan cerca como se requiera con una función de la forma 


oo 

y 


+ ni eos t + ■■■ + a„ eos nt + b\ sen t + • • • + b n sen nt 


(4) 


para un valor de n suficientemente grande. La función (4) es un polinomio trigonométrico. 
Si a n y h„ no son ambas cero, entonces el polinomio es de orden n. La conexión entre polino¬ 
mios trigonométricos y otras funciones en C[0 , 27t] depende del hecho de que para cualquier 
« > 1, el conjunto 


{1, eos t, eos 2 t,..., eos nt, sen t, sen 2r,..., sen nt) 


(5) 


sea ortogonal con respecto al producto interior 

/»2 71 

</.*)=/ ñt)g(t)dt 
Jo 


( 6 ) 


Esta ortogonalidad se comprueba como en el siguiente ejemplo y en los ejercicios 5 y 6. 


EJEMPLO 3 Considere que C[0, 27 t] tiene el producto interior (6), y sean m y n enteros 
positivos diferentes. Demuestre que eos mt y eos nt son ortogonales. 

SOLUCION Utilice una identidad trigonométrica. Cuando m ¥= n. 


(eos mt, eos nt) = 

Jo 

1 [ ¿n 

= - I [cos(/ní + nt) + eos (mt — nt)] 

- Jo 


eos mt eos nt dt 

r*2jl 


dt 


1 Vsen{mt + nt) sen (mt — nt) 

2 |_ m + n m — n 


2n 


= o 


Sea W el subespacio de C[0, 277] generado por las funciones de la ecuación (5). Dada 
/ en C[0, 277 ], la mejor aproximación a / mediante funciones en W es la aproximación 
de Fourier de n-ésimo orden sobre [0, 2 77]. Puesto que las funciones de la ecuación (5) 
son ortogonales, la mejor aproximación está dada por la proyección ortogonal sobre W. 
En este caso, los coeficientes y ¿>a de la ecuación (4) son los coeficientes de Fourier de/. 
La fórmula estándar para una proyección ortogonal indica que 


cik 


(f eos kt) 
(eos kt, eos kt) ' 


bk 


(f, sen kt) 
(sen kt, sen kt)' 


k > 1 


En el ejercicio 7 se le pide demostrar que (eos kt, eos kt) = ir y (sen kt, sen kt) = 77. Así, 

1 r 2n 1 r 2n 

ak= f(t) coskt dt, bk = f(t) sen kt dt (7) 

n Jo x Jo 


El coeficiente de la función (constante) 1 en la proyección ortogonal es 


(/.l) 

( 1 . 1 ) 



1 r 1 [ ln 

r - / f(t)cos(0-t)dt 

2 L Tt Jo 


ao 

~2 


donde ao está definida por (7) para k = 0. Esto explica por qué el término constante en (4) se 
escribe como ao/2. 
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EJEMPLO 4 Encuentre la aproximación de Fourier de 77 -ésimo orden a la función 
f(t) = t sobre el intervalo [0, 27 t]. 

SOLUCIÓN Calcule 


ao 1 1 

y - i'ñ 


pin 

/ t dt 

Jo 


2n 


<N 

-*— 

1_ 

to 

_1 

L 2 

lo j 


71 


y para A: > 0, empleando integración por partes, 
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1 
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t 


2 JT 
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1 t eos kt dt = 
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71 
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/ t sen kt dt = 
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Así, la aproximación de Fourier de 77-ésimo orden a/(f) = t es 


77 — 2 sen 1 — sen 2 1 -sen 3 1 

3 


2 

— sen nt 
n 


La figura 3 muestra las aproximaciones de Fourier de tercer y cuarto órdenes a/. 
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d) Tercer orden b) Cuarto orden 

FIGURA 3 Aproximaciones de Fourier de la función f(t) = t. 


La norma de la diferencia entre/y una aproximación de Fourier es el error cuadrático 
medio de la aproximación. (El término medio se refiere al hecho de que la norma está de¬ 
terminada por una integral). Es posible demostrar que el error cuadrático medio se aproxima 
a cero conforme se incrementa el orden de la aproximación de Fourier. Por esa razón, es 
común escribir 


m = 


ao 

y 


00 

+ (a m eos m t -(- b m sen mt) 

m= 1 


Esta expresión para /(í) es la serie de Fourier para / sobre (0, 277 ]. El término a m eos mt, por 
ejemplo, es la proyección de / sobre un subespacio unidimensional generado por eos mt. 


PROBLEMAS DE PRÁCTICA 


1. Sean q\{t) = 1, c¡ 2 Ít) = t y qyit) = 3^—4. Compruebe que { q\, < 72 , qi] es un conjunto 
ortogonal en C[—2, 2] con el producto interior del ejemplo 7 de la sección 6.7 (integra¬ 
ción de —2 a 2). 

2. Encuentre las aproximaciones de Fourier de primer y tercer órdenes a 


f(t) = 3 — 2 sen t + 5 sen 2t — 6 eos 2 1 
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6.8 EJERCICIOS 

1. Encuentre la recta de mínimos cuadrados y = + f\x que 

mejor se ajuste a los datos (—2, 0), (—1, 0), (0, 2), (1, 4) y 
(2, 4), suponiendo que el primero y el último de los puntos de 
datos son menos confiables. Pondérelos a la mitad en relación 
con los tres restantes puntos interiores. 

2. En un problema de mínimos cuadrados ponderados, suponga 
que 5 de 25 puntos de datos tienen una medición de y que es 
menos confiable que las demás, y en consecuencia se deben 
ponderar a la mitad en relación con los otros 20 puntos. Un mé¬ 
todo consiste en ponderar los 20 puntos por un factor de 1 , y 
los otros 5 por un factor de 5 . Un segundo método consiste 
en ponderar los 20 puntos por un factor de 2, y los otros 5 por 
un factor de 1. ¿Estos dos métodos producen resultados dife¬ 
rentes? Explique su respuesta. 

3. Ajuste una función de tendencia cúbica a los datos del ejemplo 
2. El polinomio cúbico ortogonal es pft) = |í 3 — ¿rí. 

4. Para realizar un análisis de tendencia de seis puntos de datos 
igualmente espaciados, se pueden emplear polinomios ortogo¬ 
nales con respecto a la evaluación en los puntos t = —5, —3, 
-1, 1, 3 y 5. 

a) Demuestre que los primeros tres polinomios ortogonales 
son 

p 0 (t) = 1 , pi(t) = t y p 2 (t) = fí 2 - f 

(El polinomio p 2 se escaló para que sus valores en los puntos 

de evaluación fueran enteros pequeños). 

b ) Ajuste una función de tendencia cuadrática a los datos 
(-5.1), (-3,1), (-1,4), (1,4), (3, 6 ), (5, 8 ) 

En los ejercicios 5 a 14, el espacio es C[0, 2 - 77 ] con el producto 
interior ( 6 ). 

5. Demuestre que sen mt y sen nt son ortogonales cuando m + n. 

6 . Demuestre que sen mt y eos nt son ortogonales para todos los 
enteros positivos m y n. 

7. Demuestre que ||cos kt\\ 2 = ir y ||sen kt\\ 2 para k > 0. 

8 . Encuentre la aproximación de Fourier de tercer orden a 
f(t) = t - 1 . 


9. Obtenga la aproximación de Fourier de tercer orden a 
/(0 = 2 tt - t. 

10. Determine la aproximación de Fourier de tercer orden a la 
función de onda cuadrada, f(f) = 1 para 0 £ t < 77 y f(t) = — 1 
para ir < í < 277. 

11. Encuentre la aproximación de Fourier de tercer orden a sen 2 f, 
sin efectuar cálculos con integrales. 

12. Obtenga la aproximación de Fourier de tercer orden a cos 3 í, 
sin efectuar cálculos con integrales. 

13. Explique por qué un coeficiente de Fourier de la suma de dos 
funciones es la suma de los coeficientes de Fourier correspon¬ 
dientes de las dos funciones. 

14. Suponga que los primeros pocos coeficientes de Fourier de 
alguna función / en C[0, 277] son a o, ai, a 2 , y b\, b 2 , b 3 . ¿Cuál 
de los siguientes polinomios trigonométricos es más cercano 
a /? Argumente su respuesta. 

a 0 

g(t) = — + ai eos t + a 2 eos 2 1 + sen t 
a 0 

h(t) = — + a¡ eos t + a 2 eos 2 1 + b\ sen t + b 2 sen 2 1 

15. [M] Consulte los datos del ejercicio 13 de la sección 6.6, con¬ 
cernientes al despegue de un avión. Suponga que los errores de 
las posibles mediciones aumentan conforme se incrementa la 
rapidez del avión, y sea W la matriz ponderada diagonal cuyas 
entradas diagonales son 1, 1, 1, .9, .9, .8, .7, .6, .5, .4, .3, .2 y .1. 
Encuentre la curva cúbica que se ajuste a los datos con error de 
mínimos cuadrados ponderados, y úsela para estimar la velo¬ 
cidad del avión cuando t = 4.5 segundos. 

16. [M] Sean y las aproximaciones de Fourier de cuarto y 
quinto órdenes en C[0, 277] a la función de onda cuadrada del 
ejercicio 10. Elabore gráficas separadas de fu y f$ en el inter¬ 
valo [0. 277], y trace una gráfica de/5 en [—277, 277]. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Calcule 


/: 


2 1 

1 -t dt = -1 2 
2 2 

2 


= 0 


(? 1 .? 2 > = J 

(? 1 .? 3 ) 

(q 2 ,q 3 ) = J t-(3t 2 -4)dt = (^f 4 -2í 


1 • (3í 2 — 4 ) dt = (r — 4í) 


= 0 


-2 
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Aproximaciones de primer y tercer 
órdenes a f(t). 


2. La aproximación de Fourier de tercer orden a/es la mejor aproximación en C[0, 2w] a / 
mediante funciones (vectores) en el subespacio generado por 1, eos t, eos 2 1, eos 3f, sen t, 
sen 2 1 y sen 3í. Pero/está evidentemente en este subespacio, así que/es su propia mejor 
aproximación: 

f(t) = 3 — 2 sen t + 5 sen 2t — 6 eos 2 1 

Para la aproximación de primer orden, la función más cercana a / en el subespacio 
W = Gen {1, eos r, sen /} es 3 -- 2 sen t. Los otros dos términos en la fórmula para 
f{t) son ortogonales a las funciones en W, así que no contribuyen a las integrales que 
dan los coeficientes de Fourier para la aproximación de primer orden. 


CAPÍTULO 6 EJERCICIOS COMPLEMENTARIOS 


1. Los siguientes enunciados se refieren a vectores en IR" (o IR'") 

con el producto interior estándar. Marque cada enunciado como 

verdadero o falso. Justifique sus respuestas. 

a) La longitud de cada vector es un número positivo. 

b) Un vector v y su negativo — v tienen iguales longitudes. 

c) La distancia entre u y v es ||u — v||. 

d) Si r es cualquier escalar, entonces ||rv|| = r||v||. 

e) Si dos vectores son ortogonales, entonces son linealmente 
independientes. 

/) Si x es ortogonal a u y v, entonces x debe ser ortogonal a 
u — v. 

g) Si ||u + v || 2 = ||u|p + ||v|p, entonces u y v son ortogonales. 

h) Si ||u — v|p = ||u|P + |MP, entonces u y v son ortogonales. 

i) La proyección ortogonal de y sobre u es un múltiplo escalar 
de y. 

j) Si un vector y coincide con su proyección ortogonal sobre 
un subespacio W, entonces y está en W. 

k) El conjunto de todos los vectores en IR" ortogonales a un 
vector fijo es un subespacio de IR". 

/) Si W es un subespacio de IR", entonces W y W 1 - no tienen 
vectores en común. 

ni) Si {vi, \ 2 , V 3 } es un conjunto ortogonal y si c 1 , C 2 y C 3 
son escalares, entonces {civi, C 2 V 2 , C 3 V 3 } es un conjunto 
ortogonal. 

n) Si una matriz U tiene columnas ortonormales, entonces 
UU T = I. 

o) Una matriz cuadrada con columnas ortogonales es una ma¬ 
triz ortogonal. 

p) Si una matriz cuadrada tiene columnas ortonormales, enton¬ 
ces también tiene filas ortonormales. 

q) Si W es un subespacio, entonces ||proyw v|p + ||v — 
proyvr v|p = ||v|p. 


r) Una solución de mínimos cuadrados de Ax = b es el vector 
Ax en Col A más cercano a b, de manera que ||b — Ax|| £ 
||b — Ax|| para toda x. 

s) Las ecuaciones normales para una solución de mínimos cua¬ 
drados de Ax = b están dadas por x = (Á'A) 1 A r b. 

2. Sea {Vi,_ s v^} un conjunto ortonormal. Compruebe la si¬ 

guiente igualdad mediante inducción, iniciando con p = 2. 
Si x = C 1 V 1 + • • • + c p x p , entonces 

l|x|| 2 = N 2 + ... + M 2 

3. Sea ¡Vi,..., x p } un conjunto ortonormal en IR". Compruebe la 
siguiente desigualdad de Bessel, que es válida para toda x en 
IR": 

l|x || 2 > |x-V!p + |x-v 2 p + ••• + Ix-VpP 

4. Sea U una matriz ortogonal de n x n. Demuestre que si 
¡vi,..., v,,} es una base ortonormal para IR", entonces también 
lo es {í/vi,..., Ux n ). 

5. Demuestre que si una matriz U de n x n satisface (C/x)- 
(t/y) = x-y para todas las x y y en IR", entonces U es una ma¬ 
triz ortogonal. 

6 . Demuestre que si U es una matriz ortogonal, entonces cualquier 
valor propio real de U debe ser ± 1. 

7. Una matriz de Householder, o un reflector elemental, tiene la 
forma Q — l — 2uu r , donde u es un vector unitario. (Véase 
el ejercicio 13 en los ejercicios complementarios del capítulo 
2). Demuestre que Q es una matriz ortogonal. (Los reflectores 
elementales se utilizan a menudo en programas computaciona- 
les para construir una factorización QR de una matriz A. Si A 
tiene columnas linealmente independientes, entonces la multi¬ 
plicación por la izquierda mediante una secuencia de reflectores 
elementales puede generar una matriz triangular superior). 
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8. Sea T : IR" —» IR" una transformación lineal que preserva lon¬ 
gitudes; es decir, ||7’(x)|| = ||x|| para toda x en IR". 

a) Demuestre que T también preserva ortogonalidad; es decir, 
T(x)-T(y)= 0 siempre que x-y = 0. 

tí) Demuestre que la matriz estándar de T es una matriz orto¬ 
gonal. 


Los ejercicios 15 y 16 conciernen a la factorización de Schur (real) 
de una matriz A de n x n en la forma A = URU T , donde U es una 
matriz ortogonal y R es una matriz triangular superior de n x n. 1 

15. Demuestre que si A admite una factorización de Schur (real), 
A = URU T , entonces A tiene n valores propios reales, contando 
multiplicidades. 


9. Considere que u y v representan vectores linealmente inde¬ 
pendientes en IR" que no son ortogonales. Describa cómo en¬ 
contrar la mejor aproximación a z en IR" mediante vectores de 
la forma x\u + xyv sin construir primero una base ortogonal 
para Gen {u, v}. 

10. Suponga que las columnas de A son linealmente independien¬ 
tes. Determine qué pasa con la solución de mínimos cuadrados 
x de Ax = b cuando b se remplaza por cb para algún escalar c 
diferente de cero. 

11. Si a, by c son números distintos, entonces el siguiente sistema 
es inconsistente porque las gráficas de las ecuaciones son planos 
paralelos. Demuestre que el conjunto de todas las soluciones de 
mínimos cuadrados del sistema es precisamente el plano cuya 
ecuación es x — 2y + 5z = (a + b + c)/3. 

x — 2 y + 5 z = a 
x — 2 y + 5z = b 
x — 2y + 5z = c 

12. Considere el problema de encontrar un valor propio de una ma¬ 
triz A de n x n cuando se conoce un vector propio v aproximado. 
Puesto que v no es exactamente correcto, la ecuación 

Ax = Av (1) 

probablemente no tendrá una solución. Sin embargo, A se puede 
estimar mediante una solución de mínimos cuadrados cuando 
la ecuación (1) se analiza adecuadamente. Piense en v como en 
una matriz Vde n x 1, y considere A un vector en IR 1 , y denote el 
vector Av con el símbolo b. Luego, (1) se reduce a b = AV, que 
también se puede escribir como VA = b. Obtenga la solución de 
mínimos cuadrados de este sistema de n ecuaciones con la única 
incógnita A, y escriba esta solución empleando los símbolos ori¬ 
ginales. La estimación resultante para A se denomina cociente 
de Rciyleigh. Véase los ejercicios 11 y 12 de la sección 5.8. 

13. Siga los pasos descritos a continuación para probar las siguien¬ 
tes relaciones entre los cuatro subespacios fundamentales deter¬ 
minados por una matriz A de m x n. 


16. Sea A una matriz de n x n con n valores propios reales, contando 
multiplicidades, denotados con Ai,..., A„. Es posible demostrar 
que A admite una factorización de Schur (real). Los incisos a) 
y b) dan las ideas clave de la demostración. El resto de la de¬ 
mostración equivale a repetir a) y b) para matrices sucesivamen¬ 
te más pequeñas, y luego unir todos los resultados. 


a) Sean ui un vector propio unitario correspondiente a Ai, 
y U2,..., u n cualesquiera otros vectores tales que ¡ui,..., 
u„) sea una base ortonormal para IR", y entonces sea U = 
[ui U2 u„]. Demuestre que la primera columna de U T 
AU es Aje;, donde ei es la primera columna de la matriz 
identidad de n x n. 

b) El inciso a) implica que U T AU tiene la forma que se mues¬ 
tra abajo. Explique por qué los valores propios de A\ son 
A 2 ,..., A„. [Sugerencia: Véase los ejercicios complementa¬ 
rios del capítulo 5]. 


U T AU 


Ai 

0 


* * * * 




[M] Cuando el lado derecho de una ecuación Ax = b se modifica 
ligeramente, por ejemplo, a Ax = b + Ab para algún vector Ab, 
la solución cambia de x a x + Ax, donde Ax satisface A(Ax) = Ab. 
El cociente ||Ab||/||b|| es el cambio relativo en b (o el error relativo 
en b cuando Ab representa el error posible en las entradas de b). 
El cambio relativo en la solución es ||Ax||/||x||. Cuando A es invertible, 
el número de condición de A, representado como cond(A), aporta 
un límite de la magnitud del cambio relativo en x: 


II Axil 
INI 


< cond(A)- 


l|Ab|| 

l|b|| 


( 2 ) 


En los ejercicios 17 a 20, resuelva Ax = b y A(Ax) = Ab, y de¬ 
muestre que la desigualdad (2) es válida en cada caso. (Véase el 
análisis de matrices mal condicionadas en los ejercicios 41 a 43 de 
la sección 2.3). 


FilA = (NulA)"-, Col A = (NulA r )- L 

a ) Demuestre que Fil A está contenida en (NulA)- 1 -. (Demues¬ 
tre que si x está en Fil A, entonces x es ortogonal a cada u 
en NulA). 

tí) Suponga que rango A — r. Encuentre dim Nul A y dim (Nul 
A)"-, y entonces deduzca del inciso a) que Fil A = (Nul A) x . 
[Sugerencia: Estudie los ejercicios de la sección 6.3]. 

c) Explique por qué Col A = (Nul A)- 1 -. 

14. Explique por qué una ecuación Ax = b tiene una solución si 
y solo si b es ortogonal a todas las soluciones de la ecuación 
A r x = 0. 


'4.5 

3.1" 

, b = 

' 19.249' 

, Ab = 

.001" 

1.6 

1.1 


6.843 

-.003 






' 

'4.5 

3.1" 

, b = 

.500" 

, Ab = 

.001' 

1.6 

1.1 

-1.407 

_ —.003 _ 


1 Si se permiten números complejos, cada matriz A de n x n admite una fac¬ 
torización de Schur (compleja), A = URU^ ¡ , donde R es triangular supe¬ 
rior y U~ l es la transpuesta conjugada de U. Este hecho de gran utilidad se 
analiza en la obra Matrix Analysis, de Roger A. Horn y Charles R. Johnson 
(Cambridge: Cambridge University Press, 1985), pp.79-100. 
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19. A 


'7 -6-4 r 


.100' 


"7 -6-4 r 


-5 10-2 

10 11 7 -3 

.b = 

2.888 

-1.404 

, 20. A = 

-5 10-2 

10 11 7-3 

, b = 

19 9 7 1 


1.462 


19 9 7 1 



4.230 

-11.043 

49.991 

69.536 


.49" 


.27" 

-1.28 

Ab = 10“ 4 

7.76 

5.78 

-3.77 

8.04 


3.93 


Ab = 10“ 4 



7 

Matrices simétricas y 
formas cuadráticas 


EJEMPLO INTRODUCTORIO 

Procesamiento de imágenes 
multicanal 



Alrededor del mundo, en poco más de 80 minutos, los dos 
satélites Landsat cruzan silenciosamente el firmamento en 
órbitas casi polares, grabando imágenes del terreno y las 
líneas costeras, en franjas de 185 kilómetros de ancho. 

Luego de 16 días, cada satélite habrá transitado por encima 
de casi todos los kilómetros cuadrados de la superficie de la 
Tierra, de manera que cualquier zona se puede monitorizar 
cada ocho días. 

Las imágenes Landsat son útiles para muchos objetivos. 
Los diseñadores y planificadores urbanos las utilizan para 
estudiar la rapidez y dirección del crecimiento urbano, el 
desarrollo industrial y otros cambios en el uso del suelo. 

Esas imágenes permiten analizar la humedad del suelo en las 
zonas rurales, clasificar la vegetación de regiones remotas, 
y localizar arroyos y lagos tierra adentro. Los gobiernos 
pueden detectar y evaluar los daños de desastres naturales, 
como incendios forestales, flujos de lava, inundaciones y 
huracanes. Las agencias de protección ambiental pueden 
identificar contaminación por emisiones de humo y medir 
la temperatura del agua en lagos y ríos cerca de plantas 
de energía. 

Los sensores satelitales toman siete imágenes 
simultáneas de cada región del suelo que se va a estudiar. 

Los sensores registran energía de bandas de longitud de onda 
separadas: tres en el espectro de luz visible y cuatro en las 
bandas infrarroja y térmica. Cada imagen se digitaliza y se 
almacena como un arreglo rectangular de números, donde 


cada número indica la intensidad de la señal en un punto 
pequeño (o pixel ) correspondiente en la imagen. Cada una 
de las siete imágenes es un canal de una imagen multicanal 
o multiespectral. 

Las siete imágenes Landsat de una región fija, por lo 
general, contienen mucha información redundante, ya que 
algunos aspectos aparecen en varias imágenes. Sin embargo, 
otros aspectos, por su color o temperatura, reflejan luz que 
solo se registra en uno o dos de los sensores. Un objetivo 
del procesamiento de imágenes multiespectrales es el de 
visualizar los datos en una forma que permita extraer 
información de mejor calidad que cuando se estudia cada 
imagen por separado. 

El análisis de componentes principales es una manera 
eficaz de suprimir información redundante y concentrar, en 
tan solo una o dos imágenes compuestas, la mayor parte de 
la información de los datos iniciales. A grandes rasgos, el 
objetivo es encontrar una combinación lineal especial de 
las imágenes, es decir, una lista de pesos que en cada pixel 
combinen los siete valores correspondientes de las imágenes 
en un nuevo valor. Los pesos se eligen de manera que 
permitan ampliar, en comparación con cualquiera de las 
imágenes originales, el rango de las intensidades de luz 
(la varíanza de la escena) en la imagen compuesta (llamada 
la primera componente principal ). También es posible 
obtener imágenes adicionales de componentes, mediante 
un criterio que se explicará en la sección 7.5. 


393 
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En las fotografías tomadas sobre el Valle Railroad, 
Nevada, que se muestran a continuación se ilustra el análisis 
de componentes principales. En las fotografías a), b ) y c) se 
observan imágenes de tres bandas espectrales Landsat. La 
información total en las tres bandas se reacomoda en las tres 
imágenes de componentes principales en las fotografías d ), 
é) y/). La primera componente d) presenta (o “explica”) 
el 93.5% de la varianza de la escena presente en los datos 
iniciales. De esta forma, los datos iniciales de tres canales 


se reducen a datos de un canal, con un pérdida (en algún 
sentido) de solo el 6.5% de la varianza de la escena. 

La empresa Earth Satellite Corporation, en Rockville, 
Maryland, que amablemente proporcionó las fotos que aquí 
se incluyen, está experimentando con imágenes de 224 
bandas espectrales separadas. El análisis de componentes 
principales, esencial para esos conjuntos enormes de datos, 
por lo general reduce los datos a unas 15 componentes 
principales utilizables. 



d) Componente principal 1: 93.5%. e) Componente principal 2: 5.3%. /) Componente principal 3: 1.2%. 


En las aplicaciones, las matrices simétricas surgen, de una u otra manera, con mayor frecuen¬ 
cia que cualquier otra clase de matrices. La teoría es bella y rica, dependiendo en esencia 
de la diagonalización y la ortogonalidad, temas que se estudiaron en los capítulos 5 y 6, 
respectivamente. La diagonalización de una matriz simétrica, descrita en la sección 7.1, es el 
fundamento del análisis en las secciones 7.2 y 7.3 concernientes a formas cuadráticas. A la 
vez, la sección 7.3 es necesaria para las dos últimas secciones referentes a la descomposición 
en valores singulares y al procesamiento de imágenes descrito en el ejemplo introductorio. 
En este capítulo todos los vectores y las matrices tienen entradas reales. 
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7.1 DIAGONALIZACIÓN DE MATRICES SIMÉTRICAS 

Una matriz simétrica es una matriz A tal que A r = A. Esta matriz es necesariamente cuadra¬ 
da. Sus entradas en la diagonal principal son arbitrarias, pero sus otras entradas se presentan 
por pares, en lados opuestos de la diagonal principal. 


EJEMPLO 1 De las siguientes matrices, solo las primeras tres son simétricas: 


Simétricas: 


1 0 
0 -3 


0-1 0 
-15 8 

0 8-7 


a b 
b d 
c e 


c 

e 


f 


No simétricas: 


1 

3 



1 -4 0 

-6 1 -4 

0 -6 1 


5 4 3 2 
4 3 2 1 
3 2 10 


Para comenzar el estudio de matrices simétricas, es útil revisar el proceso de diagonali¬ 
zación de la sección 5.3. 


EJEMPLO 2 Si es posible, diagonalice la matriz A 
SOLUCIÓN La ecuación característica de A es 



0 = -A 3 + 17A 2 - 90A + 144 = -(A - 8 )(A - 6 )(A - 3) 
Los cálculos estándar producen una base para cada espacio propio: 


II 

> 

00 

II 

~-l ' 
1 

II 

C\ 

< 

K> 

II 

~-l~ 

-1 

; A = 3: v 3 = 

T 

1 


0 


2 


1 


Estos tres vectores conforman una base para IR 3 . De hecho, es fácil comprobar que {vi, v 2 , V 3 } 
es una base ortogonal de R 3 . La experiencia del capítulo 6 sugiere que una base ortonormal 
sería útil en los cálculos, así que a continuación se presentan los vectores propios normaliza¬ 
dos a uno: 



"- 1 /V 2 


-1/V6 


1/V3 

Ui = 

1 /V 2 

, u 2 = 

-1/V6 

, u 3 = 

1/V3 


0 


2/V6 


1/V3 


Sean 



-1/V2 —l/x/6 

1/V3 


"8 0 0" 

P = 

1/V2 -l/x/6 

1/V3 

, D = 

0 6 0 


0 2/V6 

1/V3 


0 0 3 


Entonces A = PDP~ l , como es usual. Pero esta vez, como P es cuadrada y tiene columnas 
ortonormales, resulta que P es una matriz ortogonal, y P 1 es simplemente P T . (Véase la 
sección 6 . 2 ). ■ 

El teorema 1 explica por qué los vectores propios del ejemplo 2 son ortogonales, ya que 
corresponden a distintos valores propios. 


Si A es simétrica, entonces dos vectores propios cualesquiera de diferentes espacios 
propios son ortogonales. 


TEOREMA 1 
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DEMOSTRACIÓN Sean vj y V 2 los vectores propios asociados a los valores propios diferen¬ 
tes Ai y A 2 . Para demostrar que vi • V 2 = 0, calcule 

A 1 Vi • V 2 = (AiVi) r v 2 = (Ay\ ) T \2 Puesto que vi es un vector propio 
= (y\A T )y 2 = y\(Ayt) Debido a que A T = A 
= vf (A 2 V 2 ) Porque V 2 es un vector propio 

= A 2 v[v 2 = A 2 Vi- v 2 


Por lo tanto, (Ai — A 2 )vi • V 2 = 0. Pero (Ai — A 2 ) A 0, así que Vi • V 2 = 0. ■ 

El tipo especial de diagonalización del ejemplo 2 es crucial para la teoría de matrices 
simétricas. Se dice que una matriz A de n x n es diagonalizable ortogonalmente si existen 
una matriz ortogonal P (con P 1 = P T ) y una matriz diagonal D tales que 

A = PDP t = PDP~ X (1) 

Esta diagonalización requiere n vectores propios ortonormales linealmente indepen¬ 
dientes. ¿Cuándo es posible esto? Si A es diagonalizable ortogonalmente como en la ecua¬ 
ción (1), entonces 


A t = (PDP t ) t = P tt D t P t = PDP t = A 

Por lo tanto, ¡A es simétrica! El teorema 2 que se presenta a continuación, muestra que, a 
la inversa, cada matriz simétrica es diagonalizable ortogonalmente. La demostración es mu¬ 
cho más difícil y se omite; la idea principal para la demostración se presentará después del 
teorema 3. 


TEOREMA 2 


Una matriz A de n x n es diagonalizable ortogonalmente si y solo si A es una matriz 
simétrica. 


Este teorema es sorprendente, ya que el trabajo realizado en el capítulo 5 sugeriría que 
es prácticamente imposible decir cuándo una matriz es diagonalizable. Pero este no es el caso 
para las matrices simétricas. 

El siguiente ejemplo se refiere a una matriz cuyos valores propios no son todos dis¬ 
tintos. 


EJEMPLO 3 


Diagonalice ortogonalmente la matriz A = 


3 -2 
-2 6 

4 2 


4 

2 

3 


, cuya ecua¬ 


ción característica es 


0 = -A 3 + 12A 2 - 21A - 98 = -(A - 7) 2 (A + 2) 


SOLUCIÓN Los cálculos usuales producen bases para los espacios propios: 



T 


~ —1/2 ~ 


-1 

II 

> 

II 

*-< 

0 

, v 2 = 

1 

; A = -2: v 3 = 

-1/2 


1 


0 


1 


Aunque Vi y V 2 son linealmente independientes, no son ortogonales. Recuerde de la sec- 

V?" Vi 

ción 6.2 que la proyección de V 2 sobre vi es —-vi, y que la componente de V 2 ortogonal 


v 2 -Vi 

Z2 = V 2 -Vi = 

'—1/2' 

1 

-1/2 

T 

0 


-1/4" 

1 

Vi-Vi 

0 

2 

1 


!/4_ 
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TEOREMA 3 


Entonces {Vi, Z 2 ¡ es un conjunto ortogonal en el espacio propio para A = 7. (Observe que 
Z 2 es una combinación lineal de los vectores propios vi y V 2 , así que Z 2 está en el espacio 
propio. Esta construcción de Z 2 es justamente el proceso de Gram-Schmidt de la sección 6.4). 
Como el espacio propio tiene dos dimensiones (con la base Vi, V 2 ), el conjunto ortogonal 
¡Vi, Z 2 Í es una base ortogonal para el espacio propio, de acuerdo con el teorema de la base. 
(Véase la sección 2.9 o la 4.5). 

Al normalizar Vi y Z 2 se obtiene la siguiente base ortonormal del espacio propio para 
A = 7: 



" 1 /V 2 " 


— 1/VT8 

Ui = 

0 

, U 2 = 

4/\/T8 


_ l/\/2 _ 


1/a/Í8 


Una base ortonormal del espacio propio para A = —2 es 


u 3 


l|2v 3 || 


2v 3 


~- 2 ~ 


"-2/3 ' 

-1 

= 

-1/3 

2 


2/3 


De acuerdo con el teorema 1, u 3 es ortogonal a los vectores propios y u 3 . Por lo tanto, 
{ui, U 2 , u 3 } es un conjunto ortonormal. Sean 



" 1 /V 2 — 1 /vT 8 -2/3 


"7 

0 

0" 

p = [ Ul u 2 u 3 ] = 

0 4/VT8 -1/3 

, D = 

0 

7 

0 


1 

m 

<N 

|oo 

_ 1 


0 

0 —2 J 


Entonces P diagonaliza ortogonalmente a A, y a A = PDP 1 . ■ 

En el ejemplo 3, el valor propio 7 tiene multiplicidad dos y el espacio propio es bidimen- 
sional. Este hecho no es fortuito, como lo muestra el siguiente teorema. 


Teorema espectral 

Algunas veces el conjunto de valores propios de una matriz A se denomina el espectro de A, y 
la siguiente descripción de los valores propios se conoce como teorema espectral. 


Teorema espectral para matrices simétricas 

Una matriz simétrica A de n x n tiene las siguientes propiedades: 

a) A tiene n valores propios reales, contando las multiplicidades. 

b ) La dimensión del espacio propio para cada valor propio A es igual a la multiplicidad 
de A como una raíz de la ecuación característica. 

c) Los espacios propios son mutuamente ortogonales, en el sentido de que los vectores 
propios correspondientes a diferentes valores propios son ortogonales. 

d) A es diagonalizable ortogonalmente. 


El inciso a) se deduce del ejercicio 24 de la sección 5.5. El inciso b) se deduce fácilmente 
del inciso d). (Véase el ejercicio 31). El inciso c) es el teorema 1. A partir del inciso a), puede 
hacerse una demostración para d) utilizando el ejercicio 32 y la factorización de Schur anali¬ 
zada en el ejercicio complementario 16 del capítulo 6. Se omiten los detalles. 
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Descomposición espectral 

Suponga que A = PDP _1 , donde las columnas de P son los vectores propios ortonormales 
Ui,..., u„ de A, y los valores propios correspondientes Ai,..., A,¡ están en la matriz diagonal D. 
Entonces, como P 1 = P T , 


A = PDP t = [ Ul ••• u„] 


Ai 


r..T -i 


= [Aiui ••• A„u„ ] 


1 

o 


1 

. c 

_1 

1 

K 


1 

c . . 
a ^ 

1_ 


Utilizando la expansión columna-fila de un producto (teorema 10 de la sección 2.4), se puede 
escribir 


A = AiUiUj 7 ' + A 2 u 2 u 2 r + ••• + A„u„u[ 


( 2 ) 


A esta representación de A se le llama descomposición espectral de A porque la di¬ 
vide en partes determinadas por su espectro (valores propios). Cada término en (2) es una 
matriz de n x n de rango 1. Por ejemplo, cada columna de A i u i u es un múltiplo de ui. 
Además, cada matriz u,-uj es una matriz de proyección en el sentido de que para cada x 
en IR", el vector (u/uj)x es la proyección ortogonal de x sobre el subespacio generado por u,-. 
(Véase el ejercicio 35). 

EJEMPLO 4 Construya una descomposición espectral de la matriz A que tiene la diago- 
nalización ortogonal 


'7 2' 


"2/V5 -1/V5' 

'8 

0" 

2/V5 

1/V5' 

2 4 


.1/V5 2/V5_ 

0 

3 

.-1/V5 

2/V5_ 


SOLUCIÓN Denote las columnas de P como ui y u 2 . Entonces, 


A = 8uiuf + 3u 2 uJ 


Para comprobar esta descomposición de A, calcule 


T 

UiUj 


u 2 u[ 


2/a/5 

1/V5 


[2/V5 


1/V5] 


4/5 2/5 

2/5 1/5 


-1/V5]r 
2/V5 J L 


1/V5 


2/V5] 


1/5 -2/5 
-2/5 4/5 


y 


'32/5 

16/5' 

+ 

3/5 

-6/5' 


'7 

2' 

16/5 

8/5 

-6/5 

12/5 


2 

4 


8uiuf + 3 u 2 u 2 
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- NOTA NUMÉRICA - 

Cuando A es simétrica y no demasiado grande, los modernos algoritmos computacio- 
nales de gran desempeño calculan valores propios y vectores propios con gran preci¬ 
sión. Aplican una secuencia de transformaciones de semejanza sobre A que implican 
matrices ortogonales. Las entradas diagonales de las matrices transformadas conver¬ 
gen rápidamente a los valores propios de A. (Véase las notas numéricas de la sección 
5.2). Por lo general, el empleo de matrices ortogonales evita el acumulamiento de erro¬ 
res numéricos durante el proceso. Cuando A es simétrica, la secuencia de matrices 
ortogonales se combina para formar una matriz ortogonal cuyas columnas son vecto¬ 
res propios de A. 

Una matriz no simétrica no puede tener un conjunto completo de vectores propios 
ortogonales, pero el algoritmo continuará produciendo valores propios más o menos 
exactos. Después de eso, se requieren técnicas no ortogonales para calcular los vec¬ 
tores propios. 


PROBLEMAS DE PRÁCTICA 

1. Demuestre que si A es una matriz simétrica, entonces A 2 también es simétrica. 

2. Demuestre que si A es diagonalizable ortogonalmente, entonces A 2 también lo es. 


7.1 EJERCICIOS 

En los ejercicios 1 a 6, determine cuáles matrices son simétricas. 


-3 f 
-5 2 

0 8 


(17) 5, 2, -2; (18) 25, 3, -50; (19) 7, -2; (20) 13, 7, 1; (21) 9, 5. 1; 

( 22 ) 2 , 0 . 


3 

8 0-2 
3-2 0 


13. 


15. 


3 

1 

16 

-4 


14. 


16. 


1 

5 

-7 

24 


24 

7 


5. 


-6 2 0 
0-6 2 
0 0-6 



■ 1 

2 

1 

2 “ 









6. 

2 

1 

2 

1 


' 1 

1 

3" 


-2 

-36 

0 ' 

1 

2 

1 

2 

17. 

1 

3 

1 

18. 

-36 

-23 

0 







3 

1 

1 


0 

0 

3 


En los ejercicios 7 a 12, determine qué matrices son ortogonales. Si 
alguna es ortogonal, encuentre su inversa. 


7. 


.8 -.6 

-5 1 
2 i 


8 . 


10 . 


1/V2 -1/V2 
1/V2 1/V2 

-1 2 2 
2-1 2 
2 2-1 


19. 


21 . 


-2 4 

6 2 
2 3 . 

1 3 1 

4 1 3 

1 4 1 

3 1 4 


20 . 


22 . 


7-4 4 

-4 5 0 

4 0 9 

2 0 0 0 ' 

0 10 1 

0 0 2 0 

0 10 1 



' 2/3 

2/3 

1/3 * 


'3 1 r 


' 1 ' 

11. 

0 

1/V5 

-2/V5 

23. Sean A = 

1 3 1 

y v = 

1 


_ s/5/3 

-4/V45 

-2/V45, 


1 1 3 


1 


12 . 


.5 .5 -.5 -.5 

-.5 .5 -.5 .5 

.5 .5 .5 .5 

-.5 .5 .5 -.5 


. Compruebe que 2 es 


un valor propio de A y v un vector propio. Después, diagonalice 
A ortogonalmente. 


En los ejercicios 13 a 22, diagonalice ortogonalmente las matri¬ 
ces, dando una matriz ortogonal P y una matriz diagonal D. Para 
ahorrarle tiempo, los valores propios en los ejercicios 17 a 22 son: 



5 

-4 

-2" 


'-2" 


' 1 ' 

24. Sean A = 

-4 

5 

2 

, Vi = 

2 

y v 2 = 

1 


-2 

2 

2 


1 


0 


Compruebe que y V 2 son vectores propios de A. Después dia¬ 
gonalice A ortogonalmente. 
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En los ejercicios 25 y 26, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. 

25. a) Una matriz de n x n que es diagonalizable ortogonalmente 

debe ser simétrica. 

b) Si A T = A y si los vectores u y v satisfacen Au = 3u y 
Ay = 4v, entonces uv = 0. 

c) Una matriz simétrica de n x n tiene n valores propios reales 
distintos. 

d) Para v diferente de cero en IR", la matriz vv r es una matriz 
de proyección. 

26. a) Cada matriz simétrica es diagonalizable ortogonalmente. 

b) Si B = PDP T , donde P T = P~ l y D es una matriz diagonal, 
entonces B es una matriz simétrica. 

c) Una matriz ortogonal es diagonalizable ortogonalmente. 

d) La dimensión de un espacio propio de una matriz simétrica 
es igual a la multiplicidad del valor propio correspondiente. 

27. Suponga que A es una matriz simétrica de n x n, y B es cual¬ 
quier matriz de n x m. Demuestre que B T AB, B T B y BB T son 
matrices simétricas. 

28. Demuestre que si A es una matriz simétrica de n x n, entonces 
(Ax)-y = x-(Ay) para toda x, y en IR”. 

29. Suponga que A es invertible y diagonalizable ortogonalmen¬ 
te. Explique por qué A -1 también es diagonalizable ortogonal¬ 
mente. 

30. Suponga que tanto A como B son diagonalizables ortogonal¬ 
mente y que AB = BA. Explique por qué AB también es diago¬ 
nalizable ortogonalmente. 

31. Sean A = PDP 1 , donde P es ortogonal y D es diagonal, y A es 
un valor propio de A de multiplicidad k. Entonces A se presenta 
k veces sobre la diagonal de D. Explique por qué la dimensión 
del espacio propio para A es k. 

32. Suponga que A = PRP _1 , donde P es ortogonal y R es trian¬ 
gular superior. Demuestre que si A es simétrica, entonces R es 
simétrica y, por lo tanto, realmente es una matriz diagonal. 

33. Construya una descomposición espectral de A del ejemplo 2. 

34. Construya una descomposición espectral de A del ejemplo 3. 

35. Sea u el vector unitario en IR", y sea B = uu r . 


a) Dada cualquier x en IR", calcule Bx y demuestre que Bx es 
la proyección ortogonal de x sobre u, como se describió 
en la sección 6.2. 

b) Demuestre que B es una matriz simétrica y que B 2 = B. 

c) Demuestre que u es un vector propio de B. ¿Cuál es el valor 
propio correspondiente? 

36. Sea B una matriz simétrica de n x n tal que B 2 = B. Cual¬ 
quier matriz de este tipo se conoce como matriz de proyección 
(o matriz de proyección ortogonal). Para cualquier y en IR", 
sean y = fiyyz = y-y. 

a) Demuestre que z es ortogonal a y. 

b) Sea W el espacio columna de B. Demuestre que y es la suma 
de un vector en VE y de un vector en W 2 -. ¿Por qué esto de¬ 
muestra que By es la proyección ortogonal de y sobre el 
espacio columna de B1 


[M] En los ejercicios 37 a 40, diagonalice ortogonalmente las ma¬ 
trices indicadas. Para practicar los métodos de esta sección, no utilice 
la rutina de vectores propios de su programa de matrices. En vez de 
ello, aplique el programa para encontrar los valores propios, y para 
cada valor propio A, obtenga una base ortonormal para Nul(A — A/), 
como en los ejemplos 2 y 3. 


5 

2 

SO 

1 

Os 


2 

5 - 

-6 9 


9 

-6 

5 2 


-6 

9 

2 5 _ 


.38 

-.18 

-.06 - 

-.04 

-.18 

.59 

-.04 

.12 

-.06 

-.04 

.47 - 

-.12 

-.04 

.12 

-.12 

.41 

.31 

.58 

.08 .44 

.58 - 

-.56 

.44 -.58 

.08 

.44 

SO 

1 

O 

00 

.44 - 

-.58 - 

-.08 .31J 

10 

2 

2 - 

-6 

2 

10 

2 - 

-6 

2 

2 

10 - 

-6 

-6 

-6 

-6 26 

9 

9 

9 

9 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. (A 2 ) T = ( AA) t = A t A t , por una propiedad de la transpuesta. Por hipótesis. A 7 = A. Así 
que (A 2 ) T = AA = A 2 , lo que demuestra que A 2 es simétrica. 

2 . Si A es diagonalizable ortogonalmente, entonces A es simétrica de acuerdo con el teo¬ 
rema 2. Según el problema de práctica 1, A 2 es simétrica y, por lo tanto, es diagonalizable 
ortogonalmente (teorema 2). 
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7.2 FORMAS CUADRÁTICAS 


Hasta ahora en este libro nos hemos concentrado en ecuaciones lineales, excepto por la sumas 
de cuadrados que se encontraron en el capítulo 6 al calcular x 7 x. Estas sumas y expresiones 
más generales, llamadas formas cuadráticas, se presentan con frecuencia en aplicaciones del 
álgebra lineal a la ingeniería (en criterios de diseño y optimización) y el procesamiento de 
señales (como potencia de ruido de salida). Las aplicaciones también surgen, por ejemplo, en 
física (como energías potencial y cinética), geometría diferencial (como la curvatura normal 
de superficies), economía (como funciones de utilidad) y estadística (en elipsoides de con¬ 
fianza). Parte de las bases matemáticas para dichas aplicaciones fluye fácilmente de nuestro 
trabajo de matrices simétricas. 

Una forma cuadrática en IR" es una función Q definida sobre R" cuyo valor en un vec¬ 
tor x de R" se puede calcular mediante una expresión de la forma Q(x) = x T Ax, donde A es 
una matriz simétrica de n x n. La matriz A se denomina matriz de la forma cuadrática. 

El ejemplo más sencillo de una forma cuadrática diferente de cero es Q(x ) = x T Ix = ||x|| 2 . 
Los ejemplos 1 y 2 revelan la conexión entre cualquier matriz simétrica A y la forma cuadrá¬ 
tica x t Ax. 


EJEMPLO 1 Sea x 


a) A 


SOLUCION 

a) x t Ax = [ X\ x 2 ' 


Xl 

X2 


. Calcule x T Ax para las siguientes matrices: 
b) A = 


r 4 

ol 

Tx, 1 

r 


4 xi 

o 

_i 

1_ 

i- 

X 

K> i 

H 

II 

X 2 ] 

. 3x2 . 


= 4x\ + 3xj 


b ) En A existen dos entradas —2. Observe cómo participan en los cálculos. La entrada (1,2) 
en A está en negritas. 



3 

-2' 

Xl 

r i 

3xi — 2x 2 

Xl x 2 ] 

-2 

7 

X2 

= [ -U x 2 ] 

—2xi + 7x 2 


= xi(3xi - 2x 2 ) + x 2 (—2xi + 7x 2 ) 

= 3x 2 — 2xix 2 — 2x 2 xi + lx\ 

= 3x¡ — 4 xix 2 + lx\ ■ 


La presencia de —4x¡x 2 en la forma cuadrática del ejemplo 1 tí) se debe a las entradas 
—2 fuera de la diagonal en la matriz A. En contraste, la forma cuadrática asociada con la 
matriz diagonal A del ejemplo la) no tiene el producto cruzado xix 2 . 


EJEMPLO 2 Para x en R 3 , sea Q{x) = 5x 2 + 3x\ + 2x| — xix 2 + 8 x 2 X 3 . Escriba esta 
forma cuadrática como x T Ax. 

SOLUCION Los coeficientes de xf, x\, x\ están en la diagonal de A. Para que A sea simé¬ 
trica, el coeficiente de x¡xj con i A j debe dividirse en partes iguales entre las entradas (i, j) 
y ( j, i) en A. El coeficiente de X|X 2 es 0. Es sencillo comprobar que: 


5 

-1/2 

0" 

Xl 

-1/2 

3 

4 

x 2 

0 

4 

2 

_X 3 _ 


Q(x) = x t Ax = [xi x 2 x 3 ] 
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EJEMPLO 3 Sea 0(x) = x\ — 8 x 1 X 2 — 5x|. Calcule el valor de g(x) para x = 


'- 3 ' 


r 21 


r n 

1 

’ 

1 

<N 

1 

_1 

y 

1 

1 

_1 


SOLUCIÓN 


Q(- 3 ,1) = (—3) 2 - 8(—3)( 1) - 5(1) 2 = 28 
0( 2 , -2) = (2) 2 - 8(2)(—2) - 5(—2) 2 = 16 
0(1, -3) = (l) 2 - 8(1)(—3) - 5(—3) 2 = -20 ■ 

En algunos casos, las formas cuadráticas son más fáciles de usar cuando no tienen pro¬ 
ductos cruzados, es decir, cuando la matriz de la forma cuadrática es una matriz diagonal. Por 
fortuna, el producto cruzado se puede eliminar realizando un adecuado cambio de variable. 


Cambio de variable en una forma cuadrática 

Si x representa un vector variable en IR", entonces un cambio de variable es una ecuación 
de la forma 


x = P y, o, de manera equivalente, y = P 'x (1) 

donde P es una matriz invertible y y es un nuevo vector variable en R". Aquí y es el vector 
de coordenadas de x con respecto a la base de R" determinada por las columnas de P. 
(Véase la sección 4.4). 

Si el cambio de variable (1) se efectúa en una forma cuadrática x 7 Ax, entonces 

x r Ax = (Py) T A(Py) = y T P T APy = y T (P T AP)y (2) 

y la nueva matriz de la forma cuadrática es P T AP. Como A es simétrica, entonces el teorema 
2 garantiza que existe una matriz ortogonal P tal que P T AP es una matriz diagonal D, y así la 
forma cuadrática en (2) se convierte en y T Dy. Esta es la estrategia del siguiente ejemplo. 


EJEMPLO 4 Realice un cambio de variable que transforme la forma cuadrática del 
ejemplo 3 en una forma cuadrática sin productos cruzados. 

SOLUCIÓN La matriz de la forma cuadrática del ejemplo 3 es 


A = 



El primer paso es que A se diagonalice ortogonalmente. Sus valores propios resultan ser 
A = 3 y A = —7. Los vectores propios unitarios asociados son: 


2 * • 

2/V5 

X — —7- 

1/V5 

j. 

-1/V5 

, /L - / . 

2/V5 


Esos vectores son automáticamente ortogonales (porque corresponden a diferentes valores 
propios), de manera que brindan una base ortonormal para R 2 . Sean 


P — 

2/V5 

1/V5 

n — 

'3 0' 

1 — 

-1/V5 

2/V5 

1 E- 7 — 

0 -7 


Entonces, A = PDP 1 y D = P l AP = P T AP, como se indicó antes. Un cambio de variable 
conveniente es 


xi 

X2 


y y = 


Ai 

P2 


x = P y, donde x = 
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TEOREMA 4 


De esta forma, 

x\ — 8 x 1 X 2 — 5x\ = x^x = (Py) T A(Py) 

= y T P T APy = y'Dy 

= M - 7 y\ ■ 

Para ilustrar el significado de la igualdad de las formas cuadráticas del ejemplo 4, se 
puede calcular Q(x) para x = (2, —2) empleando la nueva forma cuadrática. Primero, como 
x = Py, 

y = P~ l x = P T x 

de manera que 


2/V5 

-1/V5 

2 ' 


6/V5 

1/V5 

2 / \Í5 

-2 


-2/V5 


Por lo tanto, 


3 yf - 7y\ = 3(6/V5 ) 2 - 7(-2/V5 ) 2 = 3(36/5) - 7(4/5) 

= 80/5 = 16 

Este es el valor de <2(x) en el ejemplo 3 cuando x = (2, —2). Véase la figura 1. 


x y Ax 


Multiplicación 
por P 


16 


yDy 


FIGURA 1 Cambio de variable en x T Ax. 


El ejemplo 4 ilustra el siguiente teorema. En esencia, la demostración del teorema se 
presentó antes del ejemplo 4. 


Teorema de los ejes principales 

Sea A una matriz simétrica de n x n. Luego, existe un cambio de variable ortogonal, 
x = Py, que convierte la forma cuadrática x T Ax en una forma cuadrática y T Dy sin 
productos cruzados. 


En el teorema, las columnas de P se llaman ejes principales de la forma cuadrática x T Ax. 
El vector y es el vector de coordenadas de x respecto de la base ortonormal de R" que dan 
esos ejes principales. 

Ejes principales desde un punto de vista geométrico 

Suponga que Q(x) = x r Ax, donde A es una matriz simétrica invertible de 2 x 2, y sea c una 
constante. Es posible demostrar que el conjunto de todas las x en R 2 que satisfacen 

x r Ax = c 


( 3 ) 
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corresponde a una elipse (o circunferencia), a una hipérbola, a dos rectas que se intersecan, 
a un solo punto, o quizá no contenga puntos. Si A es una matriz diagonal, la gráfica está en 
posición estándar, como se muestra en la figura 2. Si A no es una matriz diagonal, la gráfica 
de la ecuación (3) ha dado un giro respecto de la posición estándar, como se muestra en la 



elipse hipérbola 


FIGURA 2 Una elipse y una hipérbola en posición estándar. 

figura 3. Encontrar los ejes principales (determinados por los vectores propios de A) equi¬ 
vale a encontrar un nuevo sistema de coordenadas con respecto al cual la gráfica está en 
posición estándar. 



a) 5xj - 4xj.r 2 + = 48 b) Ay - 8a ^ - 5x| =16 

FIGURA 3 Una elipse y una hipérbola que no están en posición estándar. 


La hipérbola en la figura 3b) es la gráfica de la ecuación x r Ax =16, donde A es la ma¬ 
triz del ejemplo 4. El eje positivo en la figura 3b) está en la dirección de la primera co¬ 
lumna de la matriz P del ejemplo 4, y el eje y 2 positivo se encuentra en la dirección de la 
segunda columna de P. 


EJEMPLO 5 La elipse de la figura 3a) es la gráfica de la ecuación 5xf — 4x;X2 + 
5xj 2 = 48. Encuentre un cambio de variable que elimine el producto cruzado de la ecuación. 

T 5 —21 

SOLUCION La matriz de la forma cuadrática es A = ^ . . Los valores propios de A 

resultan ser 3 y 7, con los vectores propios unitarios correspondientes 




7.2 Formas cuadráticas 405 


Sea P = [ iM u 2 ] = 


1/V2 -1/V2 
1/V2 1/V2 


. Entonces, P diagonaliza ortogonalmente a A, 


de manera que el cambio de variable x = Py produce la forma cuadrática y T Dy = 3 yf + 7y|. 
La figura 3a) muestra los nuevos ejes para este cambio de variable. ■ 


Clasificación de formas cuadráticas 

Cuando A es una matriz de n x n, la forma cuadrática Q(x) = x r Ax es una función de valo¬ 
res reales con dominio R". La figura 4 presenta las gráficas de cuatro formas cuadráticas 
con dominio R 2 . Para cada punto x = (x \, x 2 ) en el dominio de una forma cuadrática Q, la 
gráfica muestra el punto (x\, x 2 , z), donde z = Q(x). Observe que, excepto en x = 0, todos 
los valores de Q(x) son positivos en la figura 4a) y todos son negativos en la figura 4 d). 
Las secciones transversales horizontales de las gráficas son elipses en la figura 4a) y 4 d), y 
son hipérbolas en la figura 4c). 



FIGURA 4 Gráficas de formas cuadráticas. 


z 



c) Z = - 7*2 


z 



Los ejemplos sencillos de 2 x 2 de la figura 4 ponen de manifiesto las siguientes 
definiciones. 


DEFINICIÓN Una forma cuadrática Q es: 

a) positiva definida si Q(x) > 0 para toda x + 0, 

b) negativa definida si Q(x) < 0 para toda x + 0, 

c) indefinida si Q(x) toma valores positivos y negativos. 

También, se dice que Q es positiva semidefinida si Q(x) > 0 para toda x, y negativa se- 
midefínida si Q(x) < 0 para toda x. Las formas cuadráticas en los incisos a) y b) de la figura 4 
son semidefinidas positivas, pero la forma en á) se describe mejor como positiva definida. 

El teorema 5 caracteriza algunas formas cuadráticas en términos de valores propios. 

TEOREMA 5 Formas cuadráticas y valores propios 

Sea A una matriz simétrica de n x n. Así, una forma cuadrática x T Ax es: 

a) positiva definida si y solo si todos los valores propios de A son positivos, 

b ) negativa definida si y solo si todos los valores propios de A son negativos, o 

c) indefinida si y solo si A tiene valores propios positivos y negativos. 
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z 



z 



x 


i 


Indefinida 



DEMOSTRACIÓN De acuerdo con el teorema de los ejes principales, existe un cambio or¬ 
togonal de variable x = Py tal que 

Q(x) = x t Ax = y T Dy = Xiy¡ + X 2 y\ H-f A n y\ (4) 

donde Ai,.... A„ son los valores propios de A. Como P es invertible, existe una corresponden¬ 
cia uno a uno entre todas las x y todas las y diferentes de cero. Por lo tanto, los valores de Q(x) 
para x # 0 coinciden con los valores de la expresión en el miembro derecho de la ecuación 
(4), la cual, como es evidente, está controlada por los signos de los valores propios Ai,..., A„, 
en las tres maneras descritas en el teorema. ■ 


EJEMPLO 6 iQ(x) = 3xf + 2x\ + x\ + 4x\x 2 + 4 .T 2 X 3 es positiva definida? 

SOLUCIÓN A causa de todos los signos positivos, esta forma “parece” positiva definida. 
Pero la matriz de la forma es 


A = 


3 

2 

0 


2 0 
2 2 

2 1 


y los valores propios de A resultan ser 5, 2 y — 1. Así, Q es una forma cuadrática indefinida, y 
no positiva definida. ■ 


Con frecuencia, la clasificación de una forma cuadrática se realiza sobre la matriz de 

- la forma. Por consiguiente, una matriz A positiva definida es una matriz simétrica para la 

WEB cual la forma cuadrática x T Ax es positiva definida. Otros términos, tales como matriz posi¬ 
tiva semidefinida, se definen de manera análoga. 


- NOTA NUMÉRICA - 

Una manera rápida de determinar si una matriz simétrica es positiva definida consiste 
en intentar factorizar A en la forma A = tí r R. donde IR es triangular superior con en¬ 
tradas diagonales positivas. (Un enfoque consiste en utilizar un algoritmo ligeramente 
modificado para la factorización LU). Tal factorización de Cholesky es posible si y solo 
si A es positiva definida. Véase el ejercicio complementario 7 al final del capítulo 7. 


PROBLEMA DE PRÁCTICA 

Describa una matriz A positiva semidefinida en términos de sus valores propios. 


7.2 EJERCICIOS 


1. Calcule la forma cuadrática x r Ax, cuando A = 

y 

a) x = |~ X] 1 b) x = 


5 1/3' 

1/3 1 


c) x = 


2. Determine la forma cuadrática x T Ax, para A = 

y 


4 3 

3 2 


0 1 1 


X¡ 


2“ 


l/x/3 

x 2 

b) x = 

-1 

c) x = 

l/x/3 

_x 3 _ 


5 


l/s/3 


3. Encuentre la matriz de la forma cuadrática. Suponga que x 
está en IR 2 . 

a) 10x¡ — 6 x¡x 2 — 3xf b) 5xf + 3xix 2 

4. Obtenga la matriz de la forma cuadrática. Suponga que x está 
en IR 2 . 

a) 20.\'i + 15xix 2 — lOxf b) x¡x 2 
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5. Determine la matriz de la forma cuadrática. Suponga que x está 
en IR 3 . 

a) 8x¡ + 7xf — 3xj — 6xix 2 + 4xix 3 — 2x 2 x 3 

b) 4xix 2 + 6 xix 3 — 8x 2 x 3 

6 . Encuentre la matriz de la forma cuadrática. Suponga que x está 
en R 3 . 

a) 5x¡ — x\ 4 - 7x 3 + 5xix 2 — 3xix 3 

b) xf — 4X|X 2 + 4x 2 x 3 

7. Realice un cambio de variable, x = Py, que transforme la forma 
cuadrática x¡ + 10x¡x 2 + xf en una forma cuadrática sin pro¬ 
ducto cruzado. Determine P y la nueva forma cuadrática. 

8 . Sea A la matriz de la forma cuadrática 
9x¡ + 7xf + llxf — 8xix 2 + 8xix 3 

Es posible demostrar que los valores propios de A son 3, 9 y 15. 
Encuentre una matriz ortogonal P tal que el cambio de variable 
x — Py transforme x T Ax en una forma cuadrática sin productos 
cruzados. Determine P y la nueva forma cuadrática. 

En los ejercicios 9 a 18, clasifique las formas cuadráticas. Después 
realice un cambio de variable, x = Py, que convierta la forma cua¬ 
drática en una que no incluya productos cruzados. Escriba la nueva 
forma cuadrática. Construya P utilizando los métodos de la sección 
7.1. 

9. 3xf — 4 xix 2 4 - 6 xf 10. 9xf — 8xix 2 + 3xf 

11. 2x 3 + 10xix 2 + 2xf 12. —5xf + 4x 3 x 2 — 2xf 

13. x\ — 6xix 2 + 9xf 14. 8xf + 6x 3 x 2 

15. [M] —2xf — 6xf — 9 x 3 — 9xJ + 4 xix 2 + 4xix 3 + 4xix 4 + 
6x 3 x 4 

16. [M] \x\ + 4xf + 4x| + 4xf + 3 xiX 2 + 3x 3 x 4 — 4xiX 4 + 
4x 2 x 3 

17. [M] Xj + xf + xf + xf 4 - 9xiX 2 — 12xix 4 + 12x 2 x 3 + 9x 3 x 4 

18. [M] llxf — x\ — 1 2xiX 2 — 12xix 3 — 12xix 4 — 2x 3 x 4 

19. ¿Cuál es el valor más grande posible de la forma cuadrática 
5xf + 8xf si x = (xi, x 2 ) y x T x=l, es decir, si xf + x\ = 1? 
(Intente algunos ejemplos de x). 

20. ¿Cuál es el valor más grande de la forma cuadrática 5xf — 3xf 
si x r x = 1 ? 

En los ejercicios 21 y 22, las matrices son de n x n y los vec¬ 
tores están en R". Marque cada enunciado como verdadero o falso. 
Justifique sus respuestas. 

21. a) La matriz de una forma cuadrática es una matriz simétrica. 
tí) Una forma cuadrática no tiene productos cruzados si y solo 

si la matriz de la forma cuadrática es una matriz diagonal. 

c) Los ejes principales de una forma cuadrática x T Ax son vec¬ 
tores propios de A. 

d) Una forma cuadrática positiva definida Q satisface Q(x) > 0 
para toda x en R". 


e) Si todos los valores propios de una matriz simétrica A son 
positivos, entonces la forma cuadrática x T Ax es positiva 
definida. 

/) Una factorización de Cholesky de una matriz simétrica A 
tiene la forma A = R T R, para una matriz triangular superior 
R con entradas diagonales positivas. 

22. a) La expresión ||x|| 2 es una forma cuadrática. 

tí) Si A es simétrica y P es una matriz ortogonal, entonces el 
cambio de variable x = Py convierte x^x en una forma 
cuadrática sin productos cruzados. 

c) Si A es una matriz simétrica de 2x2, entonces el conjunto 
de x tal que x T Ax = c (para una constante c) corresponde a 
un círculo, una elipse o una hipérbola. 

d) Una forma cuadrática indefinida es positiva semidefinida 
o negativa semidefinida. 

e) Si A es simétrica y la forma cuadrática x T Ax solo tiene va¬ 
lores negativos para x # 0, entonces todos los valores pro¬ 
pios de A son negativos. 


Los ejercicios 23 y 24 muestran cómo clasificar una forma cuadrá¬ 
tica <2(x) = x T Ax, cuando A = f ^ 
los valores propios de A. 


y det A ¥= 0. sin obtener 


23. Si Ai y A 2 son los valores propios de A, entonces el polino¬ 
mio característico de A se puede escribir de dos maneras: 
det(A — AI) y (A — A()(A — A 2 ). Con base en este hecho, de¬ 
muestre que Ai + A 2 = a + d (las entradas diagonales de A) 
y AiA 2 = det A. 


24. Compruebe los siguientes enunciados. 

a) Q es positiva definida si det A > 0 y a > 0. 

b) Q es negativa definida si det A > 0 y a < 0. 

c) Q es indefinida si det A < 0. 

25. Demuestre que si B es de m x n, entonces B T B es positiva se¬ 
midefinida; y si 6 es de n x n e invertible, entonces B T B es 
positiva definida. 


26. Demuestre que si una matriz A de n x n es positiva definida, 
entonces existe una matriz B positiva definida tal que A = B J B. 
[Sugerencia: Escriba A = PDP T , con P T = P^ 1 . Construya una 
matriz C diagonal tal que D = C T C, y sea B = PCP T . Demues¬ 
tre que B funciona]. 


27. Sean A y B matrices simétricas de n x n cuyos valores pro¬ 
pios son todos positivos. Demuestre que todos los valores 
propios de A + B son positivos. [Sugerencia: Considere for¬ 
mas cuadráticas]. 


28. Sea A una matriz simétrica e invertible de n x n. Demuestre que 
si la forma cuadrática x^x es positiva definida, entonces tam¬ 
bién lo es la forma cuadrática x r A _1 x. [Sugerencia: Considere 
valores propios]. 
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SOLUCIÓN AL PROBLEMA DE PRÁCTICA 

Efectúe un cambio de variable ortogonal x = Py, y escriba 

x^x = y T Dy = Xiy¡ + X 2 y\ +-f X n y 2 n 

como en la ecuación (4). Si un valor propio —por ejemplo. A,— fuera negativo, entonces 
x T Ax sería negativo para la x correspondiente a y = e, (la i-ésima columna de /„). Así, to¬ 
dos los valores propios de una forma cuadrática positiva semidefinida deben ser no negativos. 
A la inversa, si los valores propios son positivos, la expansión anterior indica que x T Ax debe 
ser positiva semidefinida. 

7.3 OPTIMIZACIÓN RESTRINGIDA 

Es frecuente que ingenieros, economistas, científicos y matemáticos necesiten encontrar el 
valor máximo o mínimo de una forma cuadrática Q(x) para x en algún conjunto específico. 
Por lo común, el problema se puede adaptar de tal manera que x varíe sobre un conjunto de 
vectores unitarios. Este problema de optimización restringida tiene una solución interesante 
y elegante. El ejemplo 6 y el análisis de la sección 7.5 ilustrarán cómo se presentan en la 
práctica este tipo de problemas. 

El requisito de que un vector x en R" sea unitario se puede establecer en varias formas 
equivalentes: 

||x|| = 1, ||x|| 2 = 1, x T x = 1 

y 

x\ + x\ -I-fx„ 2 = 1 (1) 

La versión ampliada de la ecuación (1) de x 7 x = 1 se utiliza comúnmente en las apli¬ 
caciones. 

Cuando una forma cuadrática Q no tiene productos cruzados, es fácil encontrar el máxi¬ 
mo y el mínimo de Q{x) para x T x = 1. 

EJEMPLO 1 Obtenga los valores máximo y mínimo de Q(x) = 9xf + 4x\ + 3xf con 
la restricción x 7 x = 1. 

SOLUCIÓN Como x| y xy son no negativos, observe que 

4x2 - 9*2 y 3x 2 < 9x\ 

y por lo tanto, 

Q(x) = 9x\ + 4xf + 3xf 
< 9x 2 + 9x\ + 9x 2 
= 9(xj + x\ + xf) 

= 9 

siempre que x 2 + x\ + x\ = 1. Así, el valor máximo de Q(x) no puede exceder 9 cuando 
x es un vector unitario. Además, Q(x) = 9 cuando x = (1, 0, 0). Por consiguiente, 9 es el 
valor máximo de Q(x) para x 7 x = 1. 

Para encontrar el valor mínimo de Q(x), observe que 

9xj > 3x 2 , \x\ > 3x| 

y en consecuencia, 

0(x) > 3X[ + 3xf + 3xf = 3(x¡ + x\ 4- xf) = 3 

siempre que x\ + x\ + x\ = 1. Además, Q(x) = 3 cuando x¡ = 0, X2 = 0, y X3 = 1. Así, 
3 es el valor mínimo de Q(x) cuando x T x = 1. ■ 


z 



Positiva semidefinida 
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TEOREMA 6 


En el ejemplo 1 es fácil ver que la matriz de la forma cuadrática Q tiene valores propios 9, 
4 y 3, y que los valores propios mayor y menor son iguales al máximo y mínimo (restringidos) 
de Q(x), respectivamente. Se verá que lo mismo es válido para cualquier forma cuadrática. 

EJEMPLO 2 Sean A = 

gráfica de Q. La figura 2 solo muestra la parte de la gráfica dentro de un cilindro; la intersec¬ 
ción del cilindro con la superficie es el conjunto de puntos (x\, X 2 , z) tales que z = Q(xi, xi) 
y x\ + x\ = 1. Las “alturas” de esos puntos son los valores restringidos de Q(x). Geomé¬ 
tricamente, el problema de optimización restringido es localizar los puntos más alto y más 
bajo en la curva de intersección. 

Los dos puntos más altos sobre la curva están 7 unidades arriba del plano X\X 2 , en 
x\ = 0 y X 2 = ± 1. Esos puntos corresponden al valor propio 7 de A y a los vectores pro¬ 
pios x = (0, 1) y —x = (0, —1). De manera similar, los dos puntos más bajos sobre la curva 
están 3 unidades arriba del plano X 1 X 2 , y corresponden al valor propio 3 y a los vectores pro¬ 
pios (1, 0) y (-1, 0). ■ 


, y <2(x) = x T Ax para x en R 2 . La figura 1 muestra la 


z 



z 



FIGURA 2 La intersección de z = 

3.v 2 + lx\ y el cilindro xf + x\ = 1. 


En la figura 2 cada punto de la curva de intersección tiene una coordenada z entre 3 y 7, 
y para cualquier número t entre 3 y 7, existe un vector unitario x tal que Q(x) = 1. En otras 
palabras, el conjunto de todos los posibles valores de x r Ax, para ||x|| = 1, es el intervalo 
cerrado 3 < t < 7. 

Es posible demostrar que para cualquier matriz simétrica A, el conjunto de todos los 
posibles valores de x r Ax, para ||x|| = 1, es un intervalo cerrado sobre el eje real. (Véase el 
ejercicio 13). Denote los puntos extremos izquierdo y derecho de este intervalo con m y M, 
respectivamente. Es decir, sean 

m = mín ¡x^Ax : ||x|| = 1}, M = máx {x r Ax : ||x|| = 1} (2) 

En el ejercicio 12 se le pide demostrar que si A es un valor propio de A, entonces m < A < M. 
El siguiente teorema dice que m y M son en sí mismos valores propios de A, justo como 
en el ejemplo 2. 1 


Sea A una matriz simétrica, y m y M se definen como en la ecuación (2). Entonces M 
es el valor propio más grande A| de A y 77? es el valor propio más pequeño de A. El valor 
de x t Ax es M cuando x es un vector propio unitario ui correspondiente a M. El valor de 
x t Ax es m cuando x es un vector propio unitario correspondiente a m. 


1 Los términos mínimo y máximo en la ecuación (2), y menor y mayor en el teorema, se refieren al ordenamiento 
natural de los números reales, no a magnitudes. 
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DEMOSTRACION A se diagonaliza ortogonalmente como PDP 1 . Se sabe que 


x t Ax = y T Dy cuando x = Py (3) 

También, 

INI = INI = ||y|| para toda y 


porque P T P = I y ||Py|| 2 = (Py) r (Py) = y T P T Py = y T y = llyll 2 . En particular, ||y|| = 1 
si y solo si ||x|| = 1. Así, x r Ax y y r Dy asumen el mismo conjunto de valores conforme x y y 
varían sobre el conjunto de todos los vectores unitarios. 

Para simplificar la notación, suponga que A es una matriz de 3 x 3 con valores propios 
a > b > c. Arregle las columnas (los vectores propios) de P de manera que P = (ui 112 113] y 


D = 


a 

0 

0 


0 

b 

0 


0 

0 

c 


Dado cualquier vector unitario y en R 3 con coordenadas yi, y 2 , y 3 , observe que 

ay\ = ay\ 

by\ < ay\ 
cy\ < ay\ 

y se obtienen estas desigualdades: 

y T Dy = ay\ + by\ + cy\ 

<ay\ + ay2 + ay\ 

= a(y\ + y\ + y¡) 

= a||y|| 2 = a 


De esta manera, M < a, por definición de M. Sin embargo, y T Dy = a cuando y = ei = (1, 0, 
0), así que en efecto M = a. De acuerdo con la ecuación (3), la x que corresponde a y = ei es 
el vector propio ui de A, porque 


x = Peí = [ui 


u 2 


U 3 ] 


1 

0 

0 


Ul 


Por lo tanto, M = a = ef De¡ = u[Au¡, lo que demuestra el enunciado sobre M. Un ar¬ 
gumento similar demuestra que m es el valor propio más pequeño, c, y ese valor de x T Ax se 
obtiene cuando x = Pe 3 = 113. ■ 


EJEMPLO 3 


Sea A = 


3 

2 

1 


2 

3 

1 


tica x t Ax sujeta a la restricción x r x 
dicho valor máximo. 


1 

1 

4 


Encuentre el valor máximo de la forma cuadrá- 


1 , y obtenga un vector unitario en el que se alcance 


SOLUCIÓN Según el teorema 6, el valor máximo deseado es el valor propio más grande de 
A. La ecuación característica resulta ser 

0 = -A 3 + 10A 2 - 27A + 18 = -(A - 6)(A - 3)(A - 1) 


El valor propio más grande es 6. 

El máximo restringido de x r Ax se obtiene cuando x es un vector propio unitario 


para A 

Ul = 


= 6. Resuelva (A — 6/)x 

1/V3 
1/V3 • 

1/V3 


0 y encuentre un vector propio 


. Establezca 
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TEOREMA 7 


En el teorema 7 y en aplicaciones posteriores, los valores de x r Ax se calculan con restric¬ 
ciones adicionales sobre el vector unitario x. 


Sean A, y como en el teorema 6. Así, el valor máximo de x r Ax sujeto a las 
restricciones 

x T x = 1, x r Ui = 0 

es el segundo valor propio más grande, A 2 , y este máximo se logra cuando x es un 
vector propio 112 correspondiente a A 2 . 


El teorema 7 se demuestra mediante un argumento similar al anterior donde el teorema 
se reduce al caso en que la matriz de la forma cuadrática es diagonal. El siguiente ejemplo da 
una idea de la demostración para el caso de una matriz diagonal. 

EJEMPLO 4 Encuentre el valor máximo de 9x\ + 4x\ + 3x| con las restricciones 
x r x = 1 y x r Ui = 0, donde u¡ = (1,0, 0). Observe que ui es un vector propio unitario corres¬ 
pondiente al valor propio más grande A = 9 de la matriz de la forma cuadrática. 

SOLUCIÓN Si las coordenadas de x son xi, X2, x¡, entonces la restricción x 7 u 1 = 0 significa 
simplemente que x\ = 0. Para tal vector unitario, x\ + x\ = 1, y 

9x\ + 4x\ + 3*3 = 4x, + 3 X 3 
< Ax\ + 4x| 

= 4 (xf + xj) 

= 4 

Así, el máximo restringido de la forma cuadrática no excede 4. Y este valor se logra para 
x = ( 0 , 1 , 0 ), que es un vector propio para el segundo valor propio más grande de la matriz 
de la forma cuadrática. ■ 

EJEMPLO 5 Sean A la matriz del ejemplo 3 y un vector propio unitario correspon¬ 
diente al valor propio más grande de A. Encuentre el valor máximo de x T Ax sujeto a las 
condiciones 


x'x = I. x 7 u ¡ = 0 (4) 

SOLUCIÓN A partir del ejemplo 3, el segundo valor propio más grande de A es A = 3. 
Resuelva (A — 3/)x = 0 para encontrar un vector propio, y normalícelo para obtener 


U2 


1/V6 

1/V6 

-2/V6 


El vector 112 es automáticamente ortogonal a Ui porque los vectores corresponden a diferen¬ 
tes valores propios. Así, el máximo de x r Ax sujeto a las restricciones en la ecuación (4) es 3, 
que se obtiene cuando x = 112 . ■ 

El siguiente teorema generaliza el teorema 7 y, junto con el teorema 6, ofrece una útil 
caracterización de todos los valores propios de A. Se omite la demostración. 
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E 0 R E M A 8 Sea A una matriz simétrica de n x n con una diagonalización ortogonal A = POP 1 , 
donde las entradas sobre la diagonal en D están ordenadas de tal manera que Ai > Ai & 
• • • > A„ y las columnas de P son los vectores propios unitarios correspondientes m,..u„. 
Entonces, para k = 2el valor máximo de x 7 ,4x sujeto a las restricciones 

X r x = 1, X^Ui = 0, X^Ufc-i = 0 

es el valor propio Ay este máximo se logra en x = u¿-. 


El teorema 8 será útil en las secciones 7.4 y 7.5. La siguiente aplicación solo requiere 
del teorema 6. 


EJEMPLO 6 El gobierno de un condado planea reparar x cientos de millas de caminos 
públicos y puentes, y mejorar y cientos de acres de parques y áreas recreativas durante el 
próximo año. El condado debe decidir cómo distribuir sus recursos (fondos, equipo, mano 
de obra, etc.) entre esos dos proyectos. Si es más eficaz en términos de costos trabajar simul¬ 
táneamente en ambos proyectos en lugar de trabajar en uno solo, entonces x y y podrían sa¬ 
tisfacer una restricción del tipo 

4x 2 + 9y 2 < 36 

Véase la figura 3. Cada punto (x, y) en el conjunto factible sombreado representa una posible 
obra pública programada para el año. Los puntos sobre la curva de restricción, 4x 2 + 9y 2 = 36, 
utilizan las cantidades máximas de recursos disponibles. 



y 

Parques y 
recreación 

4a- 2 + 9 y 2 = 36 

Conjunto 

factible 

-1-x 

3 

Reparación de caminos y puentes 
FIGURA 3 Programas de trabajos públicos. 

Al elegir su programa de obras públicas, el condado quiere considerar las opiniones de 
sus residentes. Para medir el valor, o utilidad , que los residentes de un lugar asignarían a los 
diversos programas de trabajo (x, y), algunas veces los economistas emplean una función de 
la forma 


q(x, y) = xy 

El conjunto de puntos (x, y) en el cual q(x, y) es una constante se denomina curva de in¬ 
diferencia. En la figura 4 se muestran tres de estas curvas. Los puntos sobre una curva de 
indiferencia corresponden a las alternativas que los residentes del condado, como grupo, en¬ 
contrarían igualmente valiosas. 2 Encuentre el programa de obras públicas que maximice la 
función utilidad q. 

SOLUCION La ecuación de restricción 4x 2 + 9v 2 = 36 no describe un conjunto de vectores 
unitarios, pero un cambio de variable puede resolver el problema. Rescriba la restricción en 
la forma 



= 1 


2 Las curvas de indiferencia se analizan en Michael D. Intriligator, Ronald G. Bodkin y Cheng Hsiao, Econometric 
Models, Techniques. and Applications (Upper Saddle River, NJ: Prentice-Hall, 1996). 
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Parques y 
áreas de 
recreación 

1.4-ri- 



,4x 2 + 9y 2 = 36 

(curvas de indiferencia) 
,q(x,y) = 4 


2.1 q(x,y) = 2 

Reparación de caminos y puentes 


FIGURA 4 El programa de obras públicas óptimo 
es (2.1, 1.4). 


y defina 




es decir, x = 3x \ 


y y 


2.Í2 


Entonces, la ecuación de restricción se convierte en 

x\ + x\ = 1 


y la función utilidad se convierte en q(3x\, 2x2) = ( 3 xi)( 2 x 2 ) = 6 x 1 X 2 - Sea x = 


X\ 

*2 


Entonces, el problema es maximizar Q(x) = 6 x 1 X 2 sujeto a x r x = 1. Observe que Q(x) = 
x T Ax, donde 


A = 


0 

3 


3 

0 


Los valores propios de A son ±3, con vectores propios 


1 /V 2 


-1/V2 

1 /V 2 

para A = 3 y 

1/V2 


para 


A = —3. Así, el valor máximo de Q(x) = q(x 1 , X 2 ) es 3, que se alcanza cuando xi = I / V2 
y x 2 = 1/V2. 

En términos de las variables originales, el programa de trabajos públicos óptimo es 
x = 3xi = 3/V2 «2.1 cientos de millas de caminos y puentes, y y = 2x2 = V2 «1.4 
cientos de acres de parques y áreas de recreación. El programa de obras públicas óptimo 
es justo el punto donde se encuentran la curva de restricción y la curva de indiferencia 
q{x, y) = 3. Los puntos (x, y ) con la utilidad más alta están sobre las curvas de indiferen¬ 
cia que no tocan la curva de restricción. Véase la figura 4. ■ 


PROBLEMAS DE PRÁCTICA 

1. Sea Q(x) = 3xf 4- 3x\ + 2xiX2. Encuentre un cambio de variable que transforme Q en 
una forma cuadrática sin el producto cruzado, y determine la nueva forma cuadrática. 

2. Con Q como en el problema 1, encuentre el valor máximo de Q(x) con la restricción 
x 7 x = 1 , y determine un vector unitario en el que se logre el máximo. 


7.3 EJERCICIOS 

En los ejercicios 1 y 2, encuentre el cambio de variable x = Py que 
transforme la forma cuadrática x T Ax en y T Dy como se muestra. 

1. 5x 2 + 6x? + 7xf + 4xix 2 — 4x 2 x 3 = 9y 2 + 6yf + 3 y\ 

2. 3xf + 2x\ + 2x\ + 2xix 2 + 2xix 3 + 4x 2 x 3 = 5 y\ + 2y\ 

[Sugerencia: x y y deben tener el mismo número de coorde¬ 
nadas, de manera que la forma cuadrática que se muestra aquí 
debe tener un coeficiente cero para y 2 ]. 


En los ejercicios 3 a 6 , encuentre: a) el valor máximo de Q(x ) con 
la restricción x r x = 1 , b) un vector unitario u donde se logre este 
máximo, y c) el máximo de Q(x) con las condiciones x r x = 1 y 
x r u = 0 . 

3. Q(x) = 5x 2 + 6 x\ + 7xf + 4xix 2 — 4x 2 x 3 
(Véase el ejercicio 1). 
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4. 0(x ) = 3xj + 2xf + 2xf + 2xix 2 + 2xix 3 + 4x 2 x 3 
(Véase el ejercicio 2). 

5. O(x) = 5x¡ + 5x| — 4xix 2 

6. Q(x) = 7xj + 3xf + 3xix 2 

7. Sea Q(x) = —2x¡ — x\ + 4xix 2 + 4x 2 x 3 . Determine un vector 
unitario x en IR 3 en el cual Q(x) sea máximo, con la restricción 
x r x = 1. [Sugerencia: Los valores propios de la matriz de la 
forma cuadrática Q son 2, — 1 y —4]. 

8. Sea Q(x) = 7x\ + xf + 7xf — 8x¡x 2 — 4x 3 x 3 — 8x 2 x 3 . Obten¬ 
ga un vector unitario x en IR 3 en el que Q(x ) sea máximo, con 
la restricción x r x = 1. [Sugerencia: Los valores propios de la 
matriz de la forma cuadrática Q son 9 y —3]. 

9. Encuentre el valor máximo de Q{x) = lx\ + 3xf — 2xix 2 , con 
la restricción xf + xf = 1. (No continúe para encontrar un vec¬ 
tor donde se alcance el máximo). 

10. Obtenga el valor máximo de <9(x) = —3x¡ + 5xf — 2 xiX 2 , con 
la restricción x\ + xf = 1. (No continúe para encontrar un vec¬ 
tor donde se alcance el máximo). 

11. Suponga que x es un vector propio unitario de una matriz A 
correspondiente a un valor propio 3. ¿Cuál es el valor de x T Ax ? 


12. Sea A cualquier valor propio de una matriz simétrica A. Justi¬ 
fique el enunciado hecho en esta sección de que M, 

donde m y M se definen como en la ecuación (2). [Sugerencia: 
Encuentre una x tal que A = x r Ax], 

13. Considere que A es una matriz simétrica de n x n, y que M y m 
representan los valores máximo y mínimo de la forma cuadrática 
x T Ax: denote los vectores propios unitarios correspondientes co¬ 
mo ui y u„. Los siguientes cálculos demuestran que dado cual¬ 
quier número t entre M y m, existe un vector unitario x tal que 
t = x T Ax. Compruebe que t — (1 — a)m + aM para algún nú¬ 
mero a entre 0 y 1. Después deje que x = \/l — «u„ + V® u i- 
y demuestre que x r x = 1 y x T Ax = t. 

[M] En los ejercicios 14 a 17, siga las instrucciones para los ejer¬ 
cicios 3 a 6. 

14. xix 2 + 3xix 3 + 30xix 4 + 30x 2 x 3 + 3x 2 x 4 + x 3 x 4 

15. 3xix 2 4- 5xix 3 + 7xix 4 + 7x 2 x 3 + 5x 2 x 4 + 3x 3 x 4 

16. 4xf — 6x¡x 2 — 10xix 3 — 10xix 4 — 6x 2 x 3 — 6x 2 x 4 — 2x 3 x 4 

17. —6xf — lOxf — 13xf — 13x| — 4xix 2 — 4x|X 3 — 4x 3 x 4 + 
6x 3 x 4 



El valor máximo de Q(x ) sujeto 
a x r x = 1 es 4. 


SOLUCIONES A LOS PROBLEMAS DE PRACTICA 

1. La matriz de la forma cuadrática es A 


3 1 
1 3 


. Es fácil encontrar los valores pro¬ 
pios, 4 y 2, y los vectores propios unitarios correspondientes. 

Así que el cambio deseado de variable es x = Py, donde P = 


1/V2 

1/V2 


1/V2 

1/V2 


1/V2 -1/V2 
1/V2 1/V2 


. (Aquí 


un error común es olvidar normalizar los vectores propios). La nueva forma cuadrática 
es y T Dy = 4yf + 2y¡. 

2. El máximo de Q(x) para un vector unitario x es 4, y el máximo se logra en el vector pro¬ 


pio unitario 


1/V2' 

1/V2 


. [Una respuesta incorrecta común es 


. Este vector maximiza 


la forma cuadrática y T Dy en vez de Q(x)]. 


7.4] DESCOMPOSICIÓN EN VALORES SINGULARES 

Los teoremas de diagonalización de las secciones 5.3 y 7.1 intervienen en muchas aplica¬ 
ciones interesantes. Por desgracia, como se sabe, no todas las matrices se pueden factorizar 
como A = PDF 1 con I) diagonal. Sin embargo, ¡una factorización A = QDP 1 es posi¬ 
ble para cualquier matriz A de m x n ! Una factorización especial de este tipo, llamada des¬ 
composición en valores singulares , es una de las más útiles factorizaciones matriciales en 
álgebra lineal aplicada. 

La descomposición en valores singulares se basa en la siguiente propiedad de la diago¬ 
nalización ordinaria que se puede imitar para matrices rectangulares: los valores absolutos de 
los valores propios de una matriz simétrica A miden las cantidades que A estira o comprime 
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ciertos vectores (los vectores propios). Si Ax = Ax y ||x|| = 1, entonces 


||Ax|| = ||Ax|| = |A| ||x|| = |A| 


( 1 ) 


Si Ai es el valor propio con la mayor magnitud, entonces un vector propio unitario vi co¬ 
rrespondiente identifica una dirección en la cual el efecto de estiramiento de A es máximo. 
Es decir, la longitud de Ax se maximiza cuando x = Vi, y || Avi || = |Ai|, por la ecuación (1). 
Esta descripción de v¡ y || tiene un análogo para matrices rectangulares que conducirán a 
la descomposición en valores singulares. 


EJEMPLO 1 Si A 


4 

8 


11 

7 


14 

-2 


entonces la transformación lineal x Ax mapea 


la esfera unitaria ¡x : ||x|| = 1 ¡ en IR 3 sobre una elipse en R 2 , como se muestra en la figura 1. 
Encuentre un vector unitario x en el que la longitud ||Ax|| se maximiza, y calcule esa longitud 
máxima. 




FIGURA 1 Una transformación de IR 3 a IR 2 . 


SOLUCIÓN La cantidad ||Ax || 2 se maximiza con la misma x que maximiza ||Ax||, y ||Ax || 2 
es más fácil de estudiar. Observe que 

|| Ax || 2 = (Ax) r (Ax) = x t A t Ax = x t {A t A)x 


Además, A T A es una matriz simétrica, ya que (A T A) T = A T A TT = A T A. Así que ahora el pro¬ 
blema es maximizar la forma cuadrática x r (A r A)x sujeta a la restricción ||x|| = 1. Por el teore¬ 
ma 6 de la sección 7.3, el valor máximo es el valor propio más grande A] de A T A. Además, el 
valor máximo se alcanza en un vector propio unitario de A T A correspondiente a A;. 

Para la matriz A en este ejemplo, 


4 

8" 

" A 

11 

7 

14' 

7 


80 

100 

40" 

11 

7 

4 

Q 

= 

100 

170 

140 

14 

-2 

O 

/ 

—Z 


40 

140 

200 


Los valores propios de A T A son Ai = 360, A 2 = 90 y A 3 = 0. Los vectores propios unitarios 
correspondientes son, respectivamente. 


"1/3" 


"-2/3" 


2/3" 

2/3 

, v 2 = 

-1/3 

> v 3 = 

-2/3 

2/3 


2/3 


1/3 


El valor máximo de ||Ax || 2 es 360, que se alcanza cuando x es el vector unitario Vi. El vector 
Avi es el punto sobre la elipse de la figura 1 más alejado del origen, a saber, 


Avi 


'4 11 14' 

"1/3" 


OO 

8 7-2 

2/3 

2/3 


L«J 


Para ||x|| = 1, el valor máximo de ||Ax|| es || AvjII = V36Ó = óvlO. 


El ejemplo 1 sugiere que el efecto de A sobre la esfera unitaria en R 3 está relacionado con 
la forma cuadrática x T (A T A)x. De hecho, el comportamiento geométrico general de la trans¬ 
formación x hh> Ax se refleja en esta forma cuadrática, como se verá más adelante. 
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FIGURA 2 


Los valores singulares de una matriz de m x n 

Sea A una matriz de m x n. A r A es simétrica y se puede diagonalizar ortogonalmente. Sea 
{vi,..., v,,} una base ortonormal para R" que consiste en vectores propios de A T A, y sean 
Ai,..., A„ los valores propios asociados de A r A. Por lo tanto, para 1 < i < n, 

|| Avj || ^ = (Av;) r Avi = \J A r Av¡ 

= yT (A; V; ) Puesto que v,- es un vector propio de A r A 

= X¡ Porque v, es un vector unitario ^2) 

De esta forma, todos los valores propios de A T A son no negativos. Al volver a numerar, si es 
necesario, se puede suponer que los valores propios están arreglados de manera que 

Ai > A 2 > ••• > A„ > 0 

Los valores singulares de A son las raíces cuadradas de los valores propios de A r A, que 
se denotan con o - !,..., cr„, y se arreglan en orden decreciente. Es decir, n ¡ = VL para 
1 < i < n. De acuerdo con la ecuación (2), los valores singulares de A son las longitudes 
de los vectores Avi,..., A\ n . 


EJEMPLO 2 Sea A la matriz del ejemplo 1. Como los valores propios de A T A son 360, 90 
y 0, entonces los valores singulares de A son 

(Ti = V360 = 6\/To, 02 = V90 = 3\/l0, 03 = 0 



A partir del ejemplo 1, el primer valor singular de A es el máximo de ||Ax|| sobre todos los 
vectores unitarios, y se alcanza el máximo en el vector propio unitario vi. El teorema 7 de 
la sección 7.3 indica que el segundo valor singular de A es el máximo de ||Ax|| sobre todos los 
vectores unitarios que sean ortogonales a Vi, y este máximo se logra en el segundo vector 
propio unitario, v 2 (ejercicio 22). Para v 2 del ejemplo 1, 


Av 2 


'4 11 14" 

"-2/3 


3" 

8 7-2 

-1/3 

2/3 


-9 


Este punto está sobre el eje menor de la elipse de la figura 1, así como Avi está sobre el eje 
mayor. (Véase la figura 2). Los primeros dos valores singulares de A son las longitudes de los 
semiejes mayor y menor de la elipse. ■ 


En la figura 2, no es casual que Av¡ y Av 2 sean ortogonales, como muestra el siguiente 
teorema. 


¡ E 0 R E M A 9 Suponga que {vi,..., v„} es una base ortonormal de R" que consiste en vectores pro¬ 
pios de A r A, arreglados de tal forma que los valores propios correspondientes de A T A 
satisfacen A¡ > • • • > A,„ y suponga que A tiene r valores singulares diferentes de cero. 
Entonces, {Avi,..., Av r ] es una base ortogonal para Col A, y rango A = r. 


DEMOSTRACION Como v, y A ¡\j son ortogonales para i A j, 

(Am) t (Avj) = vfA T Avj = vf (XjVj) = 0 


Por lo tanto, {Avi,..., Av„¡ es un conjunto ortogonal. Además, ya que las longitudes de los 
vectores Avi,..., Av„ son los valores singulares de A, y puesto que hay r valores singulares 
diferentes de cero, Av, A 0 si y solo si 1 < i < r. Así que Avi,..., Av r son vectores linealmente 
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independientes, y están en Col A. Finalmente, para cualquier y en Col A, por ejemplo, y = Ax, 
se puede escribir x = cqvi + ••• + c„v„, y 

y — Ax = ciAvi H - h c r Ay r + c r+ iAv r+ i H - b c„A\„ 

= ciAvi + • • • + c r Ay r + 0 + • • • + 0 


Así,yestáen Gen [Avi,..., Av,.}, lo que demuestra que {Avi,..., Av,.} es una base (ortogonal) 
para Col A. Por lo tanto, rango A = dim Col A = r. ■ 


- NOTA NUMÉRICA - 

En algunos casos, el rango de A puede ser muy sensible a pequeños cambios en las 
entradas de A. El método evidente de contar el número de columnas pivote en A no 
funciona muy bien si A se reduce por filas con una computadora. Con frecuencia, el 
error por redondeo genera una forma escalonada con rango completo. 

En la práctica, la manera más confiable de estimar el rango de una matriz A grande 
consiste en contar el número de valores singulares diferentes de cero. En este caso, se 
supone que los valores singulares distintos de cero y extremadamente pequeños son 
iguales a cero para todos los fines prácticos, y el rango efectivo de la matriz es el núme¬ 
ro que se obtiene al contar los valores singulares restantes diferentes de cero. 1 


Descomposición en valores singulares 

La descomposición de A implica a una matriz 5 “diagonal” de m x n de la forma 


£ = 


D 

0 


0 

0 


m — r filas 


(3) 


I— n — r columnas 

donde D es una matriz diagonal de r x r para alguna r que no exceda el mínimo de m y n. [Si 
r es igual a m o n o a ambos, entonces no aparecen algunas (o todas) las matrices cero]. 


TEOREMA 10 Descomposición en valores singulares 

Sea A una matriz de m x n con rango r. Entonces existe una matriz 2 de m x n como 
la de la ecuación (3) para la cual las entradas diagonales en D son los primeros r va¬ 
lores singulares de A, oq > oq 3= ••• > <r r > 0, y existen una matriz ortogonal TJ de 
m x my una matriz ortogonal V d en x n tales que 

A = UXV T 


Cualquier factorización A = UXV T , con U y V ortogonales, X como en la ecuación (3), 
y entradas diagonales positivas en Z), se llama descomposición en valores singulares (o 
DVS) de A. Las matrices U y V no están determinadas de forma única por A, pero las entra¬ 
das diagonales en D son necesariamente los valores singulares de A. Véase el ejercicio 19. 
Las columnas de U en esta descomposición se llaman vectores singulares izquierdos de A, 
y las columnas de V se llaman vectores singulares derechos de A. 


1 En general, no es sencillo estimar el rango. Para un análisis de los aspectos sutiles implicados, véase Philip E. 
Gilí, Walter Murray y Margaret H. Wright, Numerical Linear Algebra and Optimization, vol.l (Redwood City, CA: 
Addison-Wesley, 1991), sección 5.8. 
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DEMOSTRACION Sean A, y V; como en el teorema 9, así {Avi,..., Ay r } es una base ortogo¬ 
nal para Col A. Normalice cada Av¿ para obtener una base ortonormal {ui,..., u,}, donde 


ii, 


1 


1 

Ay i = —Ay ¡ 
07 


y 


Ay i = cr, u, (1 < i < r) 


(4) 


Ahora se extiende {ui,..., u, ¡ a una base ortonormal {ui,..., u,„} de IR m , y sean 
U = [ui u 2 • • • u,„ ] y V = [vi v 2 • • • v„ ] 

Por construcción, U y V son matrices ortogonales. También, a partir de la ecuación (4), 

AV = [Avi ••• Ay r O ••• 0] = [ctiUi ••• oyu,. 0 ••• 0] 

Sea D la matriz diagonal con entradas diagonales tri,..., cr,., con S como en la ecuación 
(3) anterior. Entonces, 


UY, = [ui u 2 ••• u,„] 


07 



0 



02 



0 

0 



oy 


0 

0 


= [(TiUi ••• o>u,. 0 ••• 0] 

= AV 

Puesto que V es una matriz ortogonal, entonces UZV T = AW T = A. ■ 

Los siguientes dos ejemplos se concentran en la estructura interna de una descomposi¬ 
ción en valores singulares. Un algoritmo eficiente y numéricamente estable para esta descom¬ 
posición utilizaría un enfoque diferente. Véase la nota numérica al final de la sección. 


EJEMPLO 3 Utilice los resultados de los ejemplos 1 y 2 para construir una descompo¬ 
sición en valores singulares de A = ^ ^ . 


SOLUCIÓN Una construcción se puede dividir en tres pasos. 

Paso 1. Encuentre una diagonalización ortogonal de A T A. Es decir, determine los valores 
propios de A T A y un conjunto ortonormal correspondiente de vectores propios. Si A tuviera 
solo dos columnas, los cálculos podrían realizarse a mano. Matrices mucho más grandes, por 
lo general, requieren de un programa de matrices . 2 Sin embargo, para la matriz A en cuestión, 
los datos propios para A T A se dan en el ejemplo 1. 

Paso 2. Obtenga V y 2. Acomode los valores propios de A T A en orden decreciente. En el 
ejemplo 1, los valores propios ya están listados en orden descendente: 360, 90 y 0. Los vec¬ 
tores propios unitarios correspondientes, v¡, v 2 y V 3 , son los vectores singulares derechos 
de A. Utilizando el ejemplo 1, se construye 


V = [y 1 v 2 v 3 ] = 


1/3 -2/3 2/3 

2/3 -1/3 -2/3 
2/3 2/3 1/3 


2 Véase la Guía de estudio si se desea consultar las instrucciones adecuadas para software y la calculadora gra- 
ficadora. MATLAB, por ejemplo, puede dar los valores propios y los vectores propios mediante una sola instruc¬ 
ción, eig. 
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Las raíces cuadradas de los valores propios son los valores singulares: 

(Ti = óVÍO, @2 = 3 Vio, CT 3 = 0 

Los valores singulares diferentes de cero son las entradas diagonales de D. La matriz 2 tiene el 
mismo tamaño que A, con D en su esquina superior izquierda y ceros en las entradas restantes. 


óVÍO 0 

0 3 VTo 


E = [D 0] 


6 VIO 0 0 

0 3 VIO 0 


Paso 3. Construya U. Cuando A tiene rango r, las primeras r columnas de U son los vectores 
normalizados obtenidos de Avi,..., A\ r . En este ejemplo, A tiene dos valores singulares dife¬ 
rentes de cero, de manera que rango A = 2. Recuerde de la ecuación ( 2) y del párrafo anterior 
al ejemplo 2 que ||Avi|| = cr\ y ||Av 2 || = cr 2 . Por lo tanto, 


Ui = —Avi = 
CTl 

1 

U 2 = —Av 2 = 
ff 2 


1 

' 18' 


3/VIÓ 


óVió 

6 


í/Vió 


1 

3' 


í/VIó 

3 Vio 

-9 


-3/ Vio 


Observe que {ui, u 2 ¡ ya es una base para R 2 . por lo que no se necesitan vectores adicionales 
para U, y U = [ui u 2 ]. La descomposición en valores singulares de A es 


A = 


3 /Vio 1 /VIÓ 
1 /Vio — 3 /Vio 


t 

u 


óVió o 

0 3 Vio 

t 

s 


1/3 2/3 

2/3" 

-2/3 -1/3 

2/3 

2/3 -2/3 

1/3 _ 

t 


V T 


r 

1 -1 


EJEMPLO 4 Encuentre una descomposición en valores singulares de A 


-2 2 
2 -2 


SOLUCIÓN Primero, calcule A T A = 


9 -9 
-9 9 


. Los valores propios de A r A son 18 y 0, 


con los vectores propios unitarios correspondientes 

vi = 

Esos vectores unitarios forman las columnas de V: 

V = [ V! v 2 ] 


1 /V 2 


1 /V 2 

- 1 /V 2 

, V 2 — 

1 /V 2 


1 / V~2 1 /V 2 

— 1 / V~2 1 /V 2 


Los valores singulares son c¡\ = VÍ 8 = 3V2 y <r 2 = 0. Como solo existe un valor sin¬ 
gular distinto de cero, la “matriz” D se puede escribir como un número individual. Es de¬ 
cir, D = 3\/2. La matriz 2 tiene el mismo tamaño que A, con D en su esquina superior 
izquierda: 



” D 

0 


” 3 V 2 

0 " 

E = 

0 

0 

= 

0 

0 


0 

0 


0 

0 


Para construir U, primero se obtienen Avi y Av 2 : 



2/V2 


"0" 

Avi = 

-4/V2 

, Av 2 = 

0 


4/V2 


0 
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X 


2 


Para validar los cálculos, compruebe que || A v 1 || = or = 3\/2. Desde luego, Av 2 = 0 porque 
|| AV 2 II = 02 = 0. Hasta ahora, la única columna encontrada para U es 


Vi 



Ul 


3V2 


A\\ 


1/3 

-2/3 

2/3 


Las otras columnas de U se obtienen ampliando el conjunto {Ui} a una base ortonormal 
para R 3 . En este caso, se requieren dos vectores unitarios ortogonales 112 y U3 que sean ortogo¬ 
nales a Ui. (Véase la figura 3). Cada vector debe satisfacer u^x = 0, lo que es equivalente a 
la ecuación x\ — 2x2 + 2 x 3 = 0. Una base para el conjunto solución de esta ecuación es 



"2~ 


-2" 

Wi = 

1 

, W2 = 

0 


0 


1 


(Compruebe que wi y W 2 son ortogonales a Ui). Aplique el proceso de Gram-Schmidt (con 
normalizaciones) a {wi, W2}, para obtener 



"2/V5' 


-2/V45 

u 2 = 

í/Vs 

, u 3 = 

4/V45 


0 


5/ V45 


Finalmente, establezca U = [u 1 112 U3], tome 2 y V 1 de las ecuaciones anteriores, y escriba 



"1-1" 


1/3 

2/V5 

-2/V45 

”3^2 0~|- 

A = 

-2 2 

= 

-2/3 

1/V5 

4/V45 

0 0 


2 -2 


2/3 

0 

5/V45 

0 oj - 


1/V2 

1/V2 


-1/V2 

1/V2 


Aplicaciones de la descomposición en valores singulares 

Como se mencionó antes, la DVS se utiliza con frecuencia para estimar el rango de una 
matriz. Ahora se describirán brevemente otras aplicaciones numéricas, y en la sección 7.5 se 
expone una aplicación al procesamiento de imágenes. 

EJEMPLO 5 (El número de condición) La mayoría de los cálculos numéricos que im¬ 
plican una ecuación Ax = b son tan confiables como es posible cuando se utiliza la DVS de 
A. Las dos matrices ortogonales U y V no afectan las longitudes de vectores o los ángulos 
entre vectores (teorema 7 de la sección 6.2). Cualquier posible inestabilidad en los cálcu¬ 
los numéricos se identifica en 2. Si los valores singulares de A son extremadamente grandes 
o pequeños, los errores por redondeo son casi inevitables, pero un análisis de errores se faci¬ 
lita si se conocen las entradas en 2 y V. 

Si A es una matriz invertible de n x n, entonces la razón <J\/cr n de los valores singulares 
más grande y más pequeño da el número de condición de A. Los ejercicios 41 a 43 de la 
sección 2.3 mostraron cómo el número de condición afecta la sensibilidad de una solución de 
Ax = b ante cambios (o errores) en las entradas de A. (En realidad, un “número de condición” 
de A se puede calcular en diversas formas, pero la definición que se presenta aquí se utiliza 
ampliamente para estudiar Ax = b). ■ 

EJEMPLO 6 (Bases para subespacios fundamentales) Dada una DVS para una matriz A 
de m x n, sean Ui,..., u m los vectores singulares izquierdos. Vi,..., v„ los vectores singulares 
derechos, en,..., cr„ los valores singulares, y reí rango de A. De acuerdo con el teorema 9, 

{ui,...,u,.} (5) 


es una base ortonormal para Col A. 
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Los subespacios fundamentales en 
el ejemplo 4. 


TEOREMA 


Recuerde del teorema 3 de la sección 6.1 que (Col A) x = Nul A r . Por lo tanto, 


{Ur+l,..., u,„! 


( 6 ) 


es una base ortonormal para Nul A T . 

Puesto que ||Av,|| = cri para 1 < i < n, y cr¡ es 0 si y solo si i > r, por lo tanto los vectores 
v r +i,..., v„ generan un subespacio de Nul A de dimensión n — r. De acuerdo con el teorema 
del rango, dim Nul A = n — rango A. De ello se deduce que 

{v r+ i,..„ v„} ( 7 ) 

es una base ortonormal para Nul A, de acuerdo con el teorema de la base (en la sección 4.5). 

A partir de (5) y (6), el complemento ortogonal de Nul A r es Col A. Intercambiando A y 
A r , observe que (Nul A) L = Col A r = Fil A. En consecuencia, a partir de (7), 

{vi,...,v r } (8) 


es una base ortonormal para Fil A. 

La figura 4 resume las ecuaciones (5) a (8), pero muestra la base ortogonal 
{ cr iUi,..., oyu, } para Col A en vez de la base normalizada, con la finalidad de recordar¬ 
nos que Ay¡ = <x,u, para 1 < i < r. Las bases ortonormales explícitas para los cuatro sub¬ 
espacios fundamentales determinados por A son útiles en algunos cálculos, particularmente 
en problemas de optimización restringidos. ■ 


Multiplicación 



FIGURA 4 Los cuatro subespacios fundamentales y 
la acción de A. 


Los cuatro subespacios fundamentales y el concepto de valores singulares proporcionan 
los enunciados finales del teorema de la matriz invertible, (Recuerde que se omitieron los 
enunciados del teorema acerca de A T , ya que, de otra forma, el número de enunciados se du¬ 
plicaría). Los otros enunciados se presentaron en las secciones 2.3, 2.9, 3.2, 4.6 y 5.2. 


Teorema de la matriz invertible (concluido) 

Sea A una matriz de n x n. Entonces, cada uno de los siguientes enunciados es equiva¬ 
lente al enunciado de que A es una matriz invertible. 

u) (Col A) x = {0}. 

v) (NulA) x = IR”. 

w) Fil A = R". 

x) A tiene n valores singulares diferentes de cero. 
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EJEMPLO 7 (DVS reducida y la seudoinversa de A) Cuando 2 contiene filas o columnas 
de ceros, es posible una descomposición más compacta de A. Utilizando la notación ya es¬ 
tablecida, sea r = rango A, y U y V se particionan en submatrices cuyos primeros bloques 
contienen r columnas: 


U = [U r U m - r ], donde U r = [ Ui • • • u,- ] 
V = [V r V n - r ], donde V, = [\¡ ■■■ v r ] 


Entonces U r es de m x r, y V r es de n x r. (Para simplificar la notación, considere U m - r 
o V n - r aun cuando tal vez alguna de ellas no tenga columnas). Por lo tanto, la multiplicación 
de matrices particionadas indica que 


A = [U r 


Um—r 


' D 

o’ 

" vf 

0 

0 

V n—r _ 


= UrDVj 


(9) 


Esta factorización de A se llama descomposición en valores singulares reducida de A. 
Como las entradas diagonales en D son diferentes de cero, D es invertible. La siguiente 
matriz se llama la seudoinversa (o inversa de Moore-Penrose) de A: 

A + = V r D~ l Uj (10) 


Al final del capítulo, los ejercicios complementarios 12 a 14 exploran algunas de las propie¬ 
dades de la descomposición en valores singulares reducida y de la seudoinversa. ■ 


EJEMPLO 8 (Solución por mínimos cuadrados) Dada la ecuación Ax = b, utilice la seu¬ 
doinversa de A en la ecuación (10) para definir 

i = A + b = V, D~ l Ujh 

Entonces, a partir de la DVS en la ecuación (9), 

Ax = (U r DVj )(V r D~ l Uj b) 

= U r Dir'UJ b Porque Vj V, = I r 

= U T Uj b 

De (5) se deduce que U r Uj b es la proyección ortogonal b de b sobre Col A. (Véase el teore¬ 
ma 10 de la sección 6.3). Por lo tanto, x es una solución por mínimos cuadrados de Ax = b. 
En efecto, esta x tiene la longitud más pequeña en comparación con todas las soluciones por 
mínimos cuadrados de Ax = b. Véase el ejercicio complementario 14. ■ 


- NOTA NUMÉRICA - 

Los ejemplos 1 a 4 y los ejercicios ilustran el concepto de valores singulares y sugieren 
cómo efectuar cálculos a mano. En la práctica, se debería evitar el cálculo de A T A, por¬ 
que cualquier error en las entradas de A se eleva al cuadrado en las entradas de A r A. 
Existen métodos iterativos rápidos que producen los valores singulares y los vectores 
singulares de A con muchos decimales. 
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PROBLEMA DE PRACTICA 


WEB 


Dada una descomposición en valores singulares, A = lfZV T , encuentre una DVS de A T . 
¿Cómo están relacionados los valores singulares de A y A 7 ? 


7.4 EJERCICIOS 


matrices. 


1. 


1 0 
0 -3 


•s/6 1 

o Ve 


a 4, obtenga los valores singulares de las 


.40 

-.78 

.47" 

"7.10 

0 

0" 


A = 

.37 

-.33 

-.87 

0 

3.10 

0 

1“ - ~ ~l 


-.84 

-.52 

-.16 

0 

0 

0 


2 . 


-5 

0 


V3 2 ' 

0 s/3 


En los ejercicios 5 a 12, encuentre una DVS para cada ma¬ 
triz. [Sugerencia: En el ejercicio 11, una elección para U es 

-1/3 2/3 2/3' 

2/3 —1/3 2/3 |. En el ejercicio 12, una columna de U 

2/3 2/3 -1/3 


puede ser 


-3 

0 

2 - 
2 


.30 -.51 -.81 
.76 .64 -.12 

.58 -.58 .58 

a) ¿Cuál es el rango de A? 

b) Utilice esta descomposición de A, sin hacer cálculos, y escri¬ 
ba una base para Col A y una base para Nul A. [Sugerencia: 
Primero escriba las columnas de V], 

16. Repita el ejercicio 15 para la siguiente DVS de una matriz A 
de 3x4: 


i/ Ve 


'-.86 -.11 -.50' 

' 12.48 

0 

0 

0 

A = 

.31 .68 -.67 

0 

6.34 

0 

0 

-2/Vé 
i/Ve 

]■ 

.41 -.73 -.55 _ 

f .66 -.03 -.35 

0 

.661 

0 

0 

0 


-2 0 
0 -1 

1 3 " 

) 2 


-.13 

.65 

-.34 


-.90 -.39 -.13 
.08 -.16 -.73 
.42 -.84 -.08 


9. 


11 . 


7 1 

0 0 
5 5 

-3 1 

6 -2 
6 -2 


10 . 


12 . 


4 -2 
2 -1 
0 0 

1 

0 

-1 


13. Encuentre la DVS de A = 
baje con A r ], 


. [Sugerencia: Tra- 


14. En el ejercicio 7, obtenga un vector unitario x en el cual Ax tiene 
longitud máxima. 

15. Suponga que la siguiente factorización es una DVS de una ma¬ 
triz A, con las entradas en U y V redondeadas a dos decimales. 


En los ejercicios 17 a 24, A es una matriz de m x n con una descom¬ 
posición en valores singulares A = í/2V r , donde U es una matriz 
ortogonal de m x m, 2 es una matriz “diagonal" de m x n con r en¬ 
tradas positivas y sin entradas negativas, y V es una matriz ortogonal 
de n x n. Justifique sus respuestas. 

17. Suponga que A es cuadrada e invertible. Encuentre una des¬ 
composición en valores singulares de A~*. 

18. Demuestre que si A es cuadrada, entonces |det A\ es el produc¬ 
to de los valores singulares de A. 

19. Demuestre que las columnas de V son vectores propios de A T A, 
que las columnas de U son vectores propios de AA r , y que las 
entradas diagonales de 2 son los valores singulares de A. [Suge¬ 
rencia: Utilice la DVS para calcular A T A y AA r ], 

20. Demuestre que si A es una matriz positiva definida de n x n, 
entonces una diagonalización ortogonal A = PDP T es una des¬ 
composición en valores singulares de A. 
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21. Demuestre que si P es una matriz ortogonal de m x m, entonces 
PA y A tienen los mismos valores singulares. 

22. Justifique el enunciado del ejemplo 2 referente a que el segun¬ 
do valor singular de una matriz A es el máximo de ||Ax|| confor¬ 
me x varía sobre todos los vectores unitarios ortogonales a vi, 
siendo vi un vector singular derecho correspondiente al primer 
valor singular de A. [Sugerencia: Utilice el teorema 7 de la sec¬ 
ción 7.3], 

23. Sean U = [u¡ ••• u,„] y V = [Vi ••• v„], donde u ; y vson como 
en el teorema 10. Demuestre que 

A = ffiUivf + CT 2 U 2 V 2 H-1- a r u r v^ 


[M] Calcule una DVS para cada matriz en los ejercicios 26 y 27. 
Informe las entradas matriciales finales con dos decimales. Utilice 
el método de los ejemplos 3 y 4. 


-18 

13 


-4 

4 

2 

19 


-4 

12 

-14 

11 

- 

-12 

8 

-2 

21 


4 

8 

6 

-8 - 

-4 

5 

-4 

2 

7 - 

-5 

-6 

4 

0 

-1 - 

-8 

2 

2 

-1 

-2 

4 

4 

-8 


24. Utilizando la notación del ejercicio 23, demuestre que 
A T Uj = (TjVj para 1 £j£r = rango A. 

25. Sea T : IR" —» IR'" una transformación lineal. Describa cómo 
encontrar una base B para R" y una base C para R'" tal que 
la matriz para T respecto de B y C sea una matriz “diagonal” 
de m x n. 


28. [M] Determine los valores singulares de la matriz de 4 x 4 en 
el ejercicio 9 de la sección 2.3, y calcule el número de condi¬ 
ción oq/ovt. 

29. [M] Calcule los valores singulares de la matriz de 5 x 5 en 
el ejercicio 10 de la sección 2.3, y determine el número de 
condición a íAris- 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 

Si A = U%V T , donde X es de m x n, entonces A T = ( V T ) T E T U T = VE T U T . Esto es una 
DVS de A t , ya que V y U son matrices ortogonales y X 7 es una matriz “diagonal” de 77 x m. 
Como X y X T tienen las mismas entradas diagonales diferentes de cero, A y A r tienen los 
mismos valores singulares distintos de cero. [Nota: Si A es de 2 x 77, entonces AA r es solo 
de 2 x 2 y sus valores propios pueden ser más fáciles de calcular (a mano) que los valores 
propios de A T A], 


7.5 


APLICACIONES AL PROCESAMIENTO DE IMÁGENES Y ESTADÍSTICA 


Las fotografías satelitales en la introducción del capítulo dan un ejemplo de datos mutidi- 
mensionales, o multivariados', es decir, se trata de información organizada de manera que 
cada dato en el conjunto de datos esté identificado con un punto (vector) en IR". El principal 
objetivo de esta sección es explicar una técnica, llamada análisis de componentes principales, 
empleada para analizar datos multivariados. Los cálculos ilustrarán el uso de la diagonaliza- 
ción ortogonal y la descomposición en valores singulares. 

El análisis de componentes principales es aplicable a cualquier conjunto de datos consis¬ 
tente en listas de mediciones realizadas a una colección de objetos o individuos. Por ejemplo, 
considere un proceso químico que produce un material plástico. Para monitorizar el proceso, 
se toman 300 muestras del material producido, y cada muestra se somete a una batería de 
ocho pruebas, tales como punto de fusión, densidad, ductilidad, resistencia a la tensión, etcé¬ 
tera. El informe del laboratorio para cada muestra es un vector en R 8 , y el conjunto de tales 
vectores forma una matriz de 8 x 300, llamada matriz de observaciones. 

En términos generales, se puede decir que los datos de control del proceso son octo- 
dimensionales. Los siguientes dos ejemplos describen datos que se pueden visualizar gráfi¬ 
camente. 


EJEMPLO 1 Un ejemplo de datos bidimensionales está dado por un conjunto de pesos 
y alturas de N estudiantes de licenciatura. Sea X ; el vector de observaciones en R 2 que lista 
el peso y la altura del j-ésimo estudiante. Si w denota el peso y h la altura, entonces la matriz 
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i 


FIGURA 2 

Gráfica de dispersión de datos 
espectrales para una imagen 
satelital. 


h 


w 


FIGURA 3 Datos de peso-altura en 
la forma de desviación media. 


de observaciones tiene la forma 


W\ U>2 ■■■ W>N 

h\ I12 ••• h n 

t t t 

X, X 2 Xjv 


El conjunto de vectores de observación se puede visualizar como una gráfica de dispersión 
bidimensional. Véase la figura 1. ■ 


h 


—|- w 

FIGURA 1 Una gráfica de dispersión de 
vectores de observaciones Xi,..., Xat. 


EJEMPLO 2 Las primeras tres fotografías del Valle Railroad, Nevada, que se presentan 
en la introducción al capítulo, se pueden ver como una imagen de la región, con tres compo¬ 
nentes espectrales, ya que se hicieron mediciones simultáneas de la región con tres distintas 
longitudes de onda. Cada fotografía da diferente información sobre la misma región física. 
Por ejemplo, el primer pixel en la esquina superior izquierda de cada fotografía correspon¬ 
de al mismo lugar sobre el suelo (aproximadamente 30 metros por 30 metros). Cada pixel se 
asocia con un vector de observaciones en R 3 que lista las intensidades de la señal para ese 
pixel en las tres bandas espectrales. 

Por lo común, una imagen es de 2000 x 2000 pixeles, por lo que existen 4 millones de 
pixeles en la imagen. Los datos para la imagen forman una matriz con 3 filas y 4 millones 
de columnas (con las columnas arregladas en cualquier orden conveniente). En este caso, 
el carácter “multidimensional” de los datos se refiere a las tres dimensiones espectrales 
más que a las dos dimensiones espaciales que naturalmente pertenecen a cualquier foto¬ 
grafía. Los datos se pueden visualizar como un cúmulo de 4 millones de puntos en R 3 , quizá 
como en la figura 2. ■ 

Media y covarianza 

Como preparación para el análisis de componentes principales, sea [X| ••• X V J una matriz de 
observaciones de p x N, tal como la que se describió anteriormente. La media muestral, M, 
de los vectores de observaciones Xi,..., X, v está dada por 

M= l^ + .-. + X*) 

Para los datos de la figura 1, la media muestral es el punto en el “centro” de la gráfica de 
dispersión. Para k = 1 sea 

X* = X* - M 

Las columnas de la matriz de p x N 

B = [X l X 2 ••• Xjv] 

tienen una media muestral cero, y se dice que B está en la forma de desviación media. Cuan¬ 
do la media muestral se resta de los datos de la figura 1, la gráfica de dispersión resultante 
tiene la forma que se observa en la figura 3. 
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Matrices simétricas y formas cuadráticas 


La matriz de covarianza (muestral) es la matriz S de p x p definida por 

1 T 

S = - BB t 

N - 1 

Como cualquier matriz de la forma BB T es positiva semidefmida, entonces S lo es. (Véase el 
ejercicio 25 de la sección 7.2 con B y B T intercambiadas). 

EJEMPLO 3 Se realizan tres mediciones en cada uno de los cuatro individuos en una 
muestra aleatoria de una población. Los vectores de observaciones son 


X, = 

~ 1 ~ 

2 

, x 2 = 

4" 

2 

, x 3 = 

"7 

8 

, x 4 = 

~8~ 

4 


1 


13 


1 


5 


Calcule la media muestral y la matriz de covarianza. 
SOLUCION La media muestral es 


M = \ [ 

" 1 ” 


4" 


~T 


~ 8 " 

u 

~ 20 ~ 


"5" 

2 

+ 

2 

+ 

8 

+ 

4 

16 

= 

4 

4 l 

1 


13 


1 


5 

1 4 

20 


5 


Restando la media muestral de Xi,..., X 4 se obtiene 



y 



3 

o 

o 


La matriz de covarianza muestral es 


5 = 1 
3 

"-4 

-2 

-4 

-1 

-2 

8 

2 

4 

-4 

3 "I 

0 

°J 

'-4 

-1 

2 

3 

-2 

-2 

4 

0 

1 1 

OO O 

1 1 

1 

"30 

18 

0 ' 


" 10 

6 

0 

18 

24 

-24 

= 

6 

8 

-8 

3 

0 

-24 

96 


0 

-8 

32 


Para analizar las entradas en S = [.v, ; ], considere que X representa un vector que varía 
sobre el conjunto de vectores de observaciones y denote las coordenadas de X como x\,...,x p . 
Entonces x\, por ejemplo, es un escalar que varía sobre el conjunto de las primeras coordena¬ 
das de Xi,..., X,v. Para j = la entrada diagonal Sj¡ en S es la varianza de x¡. 

La varianza de x¡ mide la dispersión de los valores de x¡. (Véase el ejercicio 13). En el 
ejemplo 3, la varianza de x¡ es 10 y la varianza de X 3 es 32. El hecho de que 32 sea mayor 
que 10 indica que el conjunto de las terceras entradas en los vectores de respuesta tiene una 
dispersión más amplia que el conjunto de las primeras entradas. 

La varianza total de los datos es la suma de las varianzas en la diagonal de S. En general, 
la suma de las entradas diagonales de una matriz cuadrada S se denomina traza de la matriz, 
y se representa como tr(5). Así, 


¡ varianza total ¡ = tr(5) 
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La entrada sy de S para i A j es la covarianza de x¡ y x¡. Observe que en el ejemplo 3, 
la covarianza entre x\ y x 2 es 0 porque la entrada (1, 3 ) de S es 0. Los especialistas en esta¬ 
dística dicen que x\ y X 3 no están correlacionadas. El análisis de los datos multivariados en 
Xi,..., X N se simplifica notablemente cuando la mayoría de las variables (o todas) Xi,..., x p 
no están correlacionadas, es decir, cuando la matriz de covarianza de Xi,..., X ;V es diagonal 
o casi diagonal. 


Análisis de componentes principales 

Para simplificar, suponga que la matriz [X! ••• X, v ] ya está en forma de desviación media. 
El objetivo del análisis de componentes principales es encontrar una matriz ortogonal de 
p x p, P = [ui ••• u ;) ] que determine un cambio de variable, X = PY, o 


X\ 

X 2 

= [ui u 2 •' 

•• a p] 

yi 

yi 

_ X p - 



. y P _ 


con la propiedad de que las nuevas variables y 1 ,..., y p no están correlacionadas y están en 
orden de varianza decreciente. 

El cambio ortogonal de variable X = PY significa que cada vector de observación Xa 
recibe un "nuevo nombre”, Ya, tal que X/ f = PYa-. Observe que Y/, es el vector de coordena¬ 
das de X¿- con respecto a las columnas de P, y Ya = P _1 Xa = P 7 X/ f para k = 1 N. 

No es difícil comprobar que para cualquier P ortogonal, la matriz de covarianza de 
Yi,..., Yjv es P T SP (ejercicio 11). Así, la matriz ortogonal P deseada es aquella que hace 
diagonal a P T SP. Sea I) una matriz diagonal con los valores propios Ai,..., \ p de S sobre 
la diagonal, ordenados de tal manera que A¡ > \ 2 — ••• > A ; , > 0, y sea P una matriz orto¬ 
gonal cuyas columnas son los vectores propios unitarios correspondientes ui,..., u ;) . De esta 
forma, S = PDP T y P T SP = D. 

Los vectores propios unitarios ui,..., \x p de la matriz de covarianza S se llaman compo¬ 
nentes principales de los datos (en la matriz de observaciones). La primera componente 
principal es el vector propio correspondiente al mayor valor propio de S , la segunda com¬ 
ponente principal es el vector propio asociado al segundo mayor valor propio, y así suce¬ 
sivamente. 

La primera componente principal determina la nueva variable vi de la siguiente 
manera. Sean Ci,..., c p las entradas en ui. Como uf es la primera fila de P 1 , entonces la 
ecuación Y = P r X indica que 


y 1 = ufx = C\X\ + C 2 x 2 - b C p x p 

Así, vi es una combinación lineal de las variables originales x 1 ,..., x p , utilizando como pe¬ 
sos las entradas en el vector propio m. En forma similar, U 2 determina la variable V 2 , y 
así sucesivamente. 


EJEMPLO 4 Los datos iniciales para la imagen multiespectral del Valle Railroad (ejem¬ 
plo 2) consistían en 4 millones de vectores en R 3 . La matriz de covarianza asociada es 1 


S = 


2382.78 

2611.84 

2136.20 


2611.84 

3106.47 

2553.90 


2136.20 

2553.90 

2650.71 


1 Los datos del ejemplo 4 y de los ejercicios 5 y 6 fueron proporcionados por Earth Satellite Corporation de 
Rockville, Maryland. 
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Encuentre las componentes principales de los datos, y liste la nueva variable determinada por 
la primera componente principal. 

SOLUCION Los valores propios de S y las componentes principales asociadas (los vectores 
propios unitarios) son 

Ai = 7614.23 A 2 = 427.63 A 3 = 98.10 

".54171 ["-.48941 [ .6834" 

u i = .6295 u 2 = -.3026 u 3 = -.7157 

.5570 J |_ .8179 J |_ .1441 

Utilizando dos decimales para simplificar, la variable para la primera componente princi¬ 
pal es 

y\ = .54.n + -63x2 + .56x 3 

Esta ecuación se utilizó para crear la fotografía d) en la introducción del capítulo. Las va¬ 
riables xi, x 2 , x 3 son las intensidades de la señal en las tres bandas espectrales. Los valores 
de xi, convertidos a una escala de grises entre negro y blanco, produjeron la fotografía a). 
De manera similar, los valores de x 2 y x 3 generaron las fotografías b) y c ), respectivamente. 
En cada pixel de la fotografía d), el valor en la escala de grises se calcula a partir de yi, una 
combinación lineal ponderada de X\, x 2 , x 3 . En este sentido, la fotografía d) “muestra” la pri¬ 
mera componente principal de los datos. ■ 

En el ejemplo 4, la matriz de covarianza para los datos transformados, utilizando las 
variables y\, y 2 , yi, es 

"7614.23 0 0 

D = 0 427.63 0 

0 0 98.10 

Aunque D es evidentemente más sencilla que la matriz de covarianza original S, aún no es 
notorio el mérito de construir las nuevas variables. Sin embargo, las varianzas de las variable 
yi, y 2 , y 3 aparecen sobre la diagonal de D, y sin duda la primer varianza en I) es mucho mayor 
que las otras dos. Como se verá, este hecho permitirá verificar que, en esencia, los datos son 
unidimensionales más que tridimensionales. 

Reducción de la dimensión de datos multivariados 

El análisis de componentes principales es potencialmente valioso en aplicaciones donde la 
mayor parte de la variación, o el rango dinámico, en los datos se debe a variaciones en tan 
solo unas cuantas de las nuevas variables, y¡,..., y p . 

Es posible demostrar que un cambio ortogonal de variables, X = PY, no modifica la 
varianza total de los datos. (A grandes rasgos, esto es cierto porque la multiplicación por 
la izquierda por P no altera las longitudes de los vectores ni los ángulos entre ellos. Véase 
el ejercicio 12). Esto significa que si S = PDP T , entonces 

{ varianza total) _ (varianza total 
dexi,...,x p ( | deyi,..., y p 

La varianza de y/ es Ay el cociente A ; /tr(.S') mide la fracción de la varianza total que se “ex¬ 
plica” o se “capta” con y¡. 

EJEMPLO 5 Calcule los diversos porcentajes de varianza de los datos multiespectra- 
les de Valle Railroad que se muestran en las fotografías de las componentes principales, d), 
e ), /), presentadas en la introducción del capítulo. 


| — tr (D) — A i + • • • + A p 
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SOLUCIÓN La varianza total de los datos es 


tr(D) = 7614.23 + 427.63 + 98.10 = 8139.96 


[Verifique que este número también sea igual a tr(5”)]. Los porcentajes de la varianza total 
explicados por las componentes principales son 


Primera componente 


Segunda componente Tercera componente 


7614.23 

8139.96 


93.5% 


427.63 

8139.96 


5.3% 


98.10 

8139.96 


1 . 2 % 


En un sentido, el 93.5% de la información recopilada por Landsat para la región de Valle 
Railroad se presenta en la fotografía d ), el 5.3% en é) y solamente el 1.2% restante en /). ■ 

Los cálculos del ejemplo 5 revelan que los datos prácticamente no tienen varianza en la 
tercera (nueva) coordenada. Todos los valores de y 3 son cercanos a cero. Geométricamente, 
los puntos de datos están cercanos al plano y 3 = 0 , y sus ubicaciones se pueden determinar 
más o menos exactamente conociendo solo los valores de y\ y y 2 . De hecho, y 2 también tiene 
una varianza relativamente pequeña, lo que significa que los puntos están aproximadamente 
sobre una recta, y los datos, en esencia, son unidimensionales. Véase la figura 2, en la que los 
datos semejan un palo de paleta. 

Caracterizaciones de las variables de componentes 
principales 

Si yi,..., y p se originan de un análisis de componentes principales de una matriz de observa¬ 
ciones de p x N, entonces la varianza de y \ es tan grande como sea posible en el siguiente 
sentido: si u es cualquier vector unitario y si y = u r X, entonces la varianza de los valores de 
y cuando X varía sobre los datos originales Xi,..., X,v es u 7 .S'u. De acuerdo con el teorema 8 
de la sección 7.3, el valor máximo de u r 5 u, sobre todos los vectores unitarios u, es el mayor 
valor propio Ai de S, y esta varianza se alcanza cuando u es el vector propio correspondien¬ 
te ui. De manera similar, el teorema 8 indica que V 2 tiene la máxima varianza posible entre 
todas las variables y = u r X que no están correlacionadas con y\. De igual forma, y 3 tiene 
la máxima varianza posible entre todas las variables no correlacionadas con yi y y 2 , y así 
sucesivamente. 

- NOTA NUMÉRICA - 

La descomposición en valores singulares es la herramienta más importante para efectuar 
el análisis de componentes principales en aplicaciones prácticas. Si B es una matriz de 
observaciones de p x N en la forma de desviación media, y si A = (1 / V-V — 1) B T , 
entonces A T A es la matriz de covarianza, S. Los cuadrados de los valores singulares de 
A son los p valores propios de S, y los vectores singulares derechos de A son las com¬ 
ponentes principales de los datos. 

Como se mencionó en la sección 7.4, el cálculo iterativo de la DVS de A es más 
rápido y preciso que una descomposición de valores propios de S. Esto es particu¬ 
larmente cierto, por ejemplo, en el procesamiento de imágenes hiperespectrales (con 
p = 224) que se mencionó en la introducción del capítulo. El análisis de componentes 
principales se completa en segundos en estaciones de trabajo especializadas. 


Lectura adicional 

Lillesand, Thomas M. y Ralph W. Kiefer, Remóte Sensing and Image Interpretador 1 , 4a. ed. 
(Nueva York: John Wiley, 2000). 
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PROBLEMAS DE PRÁCTICA 

La siguiente tabla lista los pesos y las estaturas de cinco jóvenes: 


Joven 

#1 

#2 

#3 

#4 

#5 

Peso (Ib) 

120 

125 

125 

135 

145 

Altura (in.) 

61 

60 

64 

68 

72 


1. Encuentre la matriz de covarianza para los datos. 

2. Realice un análisis de componentes principales de los datos para encontrar un solo índice 
de tamaño que explique la mayor parte de la variación en los datos. 


7.5 EJERCICIOS 


En los ejercicios 1 y 2, convierta la matriz de observaciones a la 
forma de desviación media y construya la matriz de covarianza de 
la muestra. 

T 19 22 6 3 2 20' 

|_ 12 6 9 15 13 5 

I" 1 5 2 6 7 3" 

2 '3 11 6 8 15 11 


3. Encuentre las componentes principales de los datos del ejer¬ 
cicio 1. 


4. Encuentre las componentes principales de los datos del ejerci¬ 
cio 2. 


5. [M] Se tomó una imagen Landsat con tres componentes es¬ 
pectrales de la base Homestead de la Fuerza Aérea, en Florida 
(después de que la base sufrió los estragos provocados por el 
huracán Andrew en 1992). La matriz de covarianza de los datos 
se muestra a continuación. Determine la primera componente 
principal de los datos, y calcule el porcentaje de la varianza total 
que está contenida en esa componente. 


S = 


164.12 

32.73 

81.04 


32.73 

539.44 

249.13 


81.04 

249.13 

189.11 


6 . [M] La siguiente matriz de covarianza se obtuvo de una imagen 
Landsat del río Columbia, Washington, utilizando datos de tres 
bandas espectrales. Sean xi, X 2 , X 3 las componentes espectrales 
de cada pixel en la imagen. Encuentre una nueva variable de la 
forma vi = c¡X\ + C 2 X 3 + C 3 X 3 que tenga la máxima varianza po¬ 
sible, sujeta a la restricción c¡ + cf + c\ = 1. ¿Qué porcentaje 
de la varianza total en los datos se explica mediante yi? 


S = 


29.64 

18.38 

5.00 


18.38 

20.82 

14.06 


5.00 

14.06 

29.21 


7. Sean x\, X 2 las variables para los datos bidimensionales del 
ejercicio 1. Determine una nueva variable yi de la forma 
yi = C 1 X 1 + C 2 X 2 , con c¡ + c| = 1. tal que yi tenga la má¬ 
xima varianza posible sobre los datos proporcionados. ¿Qué 
parte de la varianza en los datos se explica por yi? 

8. Repita el ejercicio 7 para los datos del ejercicio 2. 


9. Suponga que se aplican tres pruebas a una muestra aleatoria 
de estudiantes de licenciatura. Sean Xi,..., Xn los vectores de 
observaciones en IR 3 que listan las tres calificaciones de cada 
estudiante, y para j = 1, 2, 3, denote con x¡ la calificación de 
un estudiante en el y'-ésimo examen. Suponga que la matriz 
de covarianza de los datos es 


5 = 


5 

2 

0 


2 

6 

2 


0 

2 

7 


Sea y un "índice” de desempeño de estudiantes, con y = ciX\ + 
C 2 X 2 + C3.V3 y c 3 + c\ + c\ = 1. Seleccione c\, C 2 , C3 de ma¬ 
nera que la varianza de y sobre el conjunto de datos sea lo más 
grande posible. [Sugerencia: Los valores propios de la matriz de 
covarianza de la muestra son A = 3, 6 y 9]. 


10. [M] Repita el ejercicio 9 con S 


5 4 2 

4 114 

2 4 5 


11. A partir de los datos multivariados Xi,..., X/v (en en la 
forma de desviación media, sea P una matriz de p x p, y defina 
Y* = P r X k para k = 1,..., A. 


a) Demuestre que Yi,..., Yjv están en la forma de desviación 
media. [Sugerencia: Deje que w sea el vector en IR^ con un 
1 en cada entrada. Entonces [Xi • ■ • X¿v] w = 0 (el vector cero 
en IRQ], 


b) Demuestre que si la matriz de covarianza de Xi,..., Xjv es S , 
entonces la matriz de covarianza de Yi,..., Yjves P T SP. 


12. Sea X un vector que varía sobre las columnas de una matriz de 
observaciones de p x N, en tanto que P es una matriz ortogonal 
de p x p. Demuestre que el cambio de variable X = PY no cam¬ 
bia la varianza total de los datos. [Sugerencia: De acuerdo con 
el ejercicio 11, es suficiente demostrar que tr (P T SP) = tr(Sj. 
Utilice una propiedad de la traza mencionada en el ejercicio 25 
de la sección 5.4], 


13. 


La matriz de covarianza de la muestra es una generalización de 
una fórmula para la varianza de una muestra de N mediciones 
escalares, por ejemplo, ti,..., tu. Si m es el promedio de ti,..., fjv, 
entonces la varianza de la muestra está dada por 


1 


N - 1 


-ni ) 2 

k= 1 


( 1 ) 
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Muestre cómo la matriz de covarianza de la muestra, S , defini¬ 
da antes del ejemplo 3, se puede escribir en una forma similar 
a (1). [Sugerencia: Utilice multiplicación de matrices particio- 


nadas para escribir a S como 1 /(TV — 1) por la suma de N ma¬ 
trices de tamaño p x p. Para 1 < k £ N, escriba — M en vez 
de X*]. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 


1. Primero arregle los datos en la forma de desviación media. Es fácil ver que el vector de la 

130' 


media muestral es M = 
de la tabla) y obtenga 


65 


B = 


-4 -5 -1 
Entonces la matriz de covarianza de la muestra es 


. Reste M de los vectores de observaciones (las columnas 


-10 -5 -5 5 15 

3 7 


S = 


1 


5-1 


-10 -5 -5 5 15 

-4 -5-1 3 7 


-10 -4 
-5 -5 


-5 

5 

15 


'400 

190' 


' 100.0 

47.5' 

190 

100 


47.5 

25.0 


2 . Los valores propios de S son (con dos decimales) 

A, = 123.02 y A 2 = 1.98 


El vector propio unitario a Ai es u 


.900 

.436 


. (Como S es de 2 x 2, los cálculos se pue¬ 


den hacer a mano si no se cuenta con un programa de matrices). Para el índice de tamaño, 
sea 


y = .900vc + .436/? 

donde v¡> y h son el peso y la altura, respectivamente, en la forma de desviación media. 
La varianza de este índice sobre el conjunto de datos es 123.02. Puesto que la varianza 
total es trió 1 ) = 100 + 25 = 125, el índice de tamaño explica prácticamente toda la va¬ 
rianza de los datos (el 98.4% de esta). 

La figura 4 muestra los datos originales para el problema de práctica 1 y la recta 
determinada por la primera componente principal u. (En forma vectorial paramétrica, la 
recta es x = M + /u). Es posible demostrar que la recta es la mejor aproximación a los 


h 

75 
70 
65 

Pulgadas 

60 
55 

—|— \ —I-1-1-1- w 

I 120 130 140 150 

Libras 

FIGURA 4 Una recta de regresión ortogonal determinada por 
la primera componente principal de los datos. 
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datos, en el sentido de que la suma de los cuadrados de las distancias ortogonales a la 
recta se minimiza. En efecto, el análisis de componentes principales es equivalente a 
la regresión ortogonal , pero eso es otra historia. Quizá se presente otra vez. 


CAPÍTULO 7 EJERCICIOS COMPLEMENTARIOS 


1. Marque cada enunciado como verdadero o falso. Justifique sus 

respuestas. En cada inciso, A representa una matriz de n x r. 

a) Si A es diagonalizable ortogonalmente, entonces A es si¬ 
métrica. 

b) Si A es una matriz ortogonal, entonces A es simétrica. 

c) Si A es una matriz ortogonal, entonces ||Ax|| = ||x|| para 
toda x en IR". 

d) Los ejes principales de una forma cuadrática x^x pueden 
ser columnas de cualquier matriz P que diagonaliza a A. 

e) Si P es una matriz de n x n con columnas ortogonales, en¬ 
tonces P T — P l . 

f) Si todo coeficiente en una forma cuadrática es positivo, 
entonces la forma cuadrática es definida positiva. 

g) Si x T Ax > 0 para alguna x, entonces la forma cuadrática 
x T Ax es positiva definida. 

H) Con un cambio adecuado de variable, cualquier forma 
cuadrática se puede convertir en una forma cuadrática sin 
productos cruzados. 

i) El valor más grande de una forma cuadrática x T Ax, para 
||x|| = 1, es la entrada más grande en la diagonal de A. 

j) El valor máximo de una forma cuadrática positiva definida 
x T Ax es el mayor valor propio de A. 

k) Una forma cuadrática positiva definida se puede convertir 
en una forma negativa definida mediante un adecuado cam¬ 
bio de variable x = Pu, para alguna matriz ortogonal P. 

/) Una forma cuadrática indefinida es aquella cuyos valores 
propios no están definidos. 

ni) Si P es una matriz ortogonal de n x n, entonces el cambio 
de variable x = Pu convierte x T Ax en una forma cuadrá¬ 
tica cuya matriz es P _1 AP. 

n) Si U es de m x n con columnas ortogonales, entonces UU T x 
es la proyección ortogonal de x sobre Col U. 

o) Si B es de m x n y x es un vector unitario en IR", entonces 
||Bx|| £ a¡, donde ai es el primer valor singular de B. 

p) Una descomposición en valores singulares de una matriz B 
de m x n se puede escribir como B = P%Q, donde P es una 
matriz ortogonal de m x m, Q es una matriz ortogonal de 
n x n, y S es una matriz “diagonal” de m x n. 

q) Si A es de n x n, entonces A y A T A tienen los mismos valores 
singulares. 

2. Sean {ui,..., u n } una base ortonormal para IR", y Ai,..., A„ 

cualesquiera escalares reales. Defina 

A = A^iuf H-1- A„u„uJ 

a) Demuestre que A es simétrica. 


b) Pruebe que Ai,..., A„ son los valores propios de A. 

3. Sea A una matriz simétrica de n x n y rango r. Explique por 
qué la descomposición espectral de A representa a esta como 
la suma de r matrices de rango 1. 

4. Sea A una matriz simétrica de n x n. 

a ) Demuestre que (Col A)- 1 - = Nul A. [Sugerencia: Véase la 
sección 6.1], 

b) Demuestre que cada y en IR" se puede escribir en la forma 
y = y + z, con y en Col A y z en Nul A. 

5. Demuestre que si v es un vector propio de una matriz A de 
n x n, y v corresponde a un valor propio de A distinto de cero, 
entonces v está en Col A. [Sugerencia: Utilice la definición 
de un vector propio], 

6. Sea A una matriz simétrica de nxn. Aplique el ejercicio 5 y una 
base de vectores propios en IR" con la finalidad de dar una se¬ 
gunda demostración de la descomposición en el ejercicio 4b). 

7. Demuestre que una matriz A de n x n es positiva definida si y solo 
si A admite una factorización de Cholesky, a saber, A = R T R 
para alguna matriz triangular superior invertible R cuyas en¬ 
tradas diagonales son todas positivas. [Sugerencia: Utilice una 
factorización QR y el ejercicio 26 de la sección 7.2], 

8. Con base en el ejercicio 7, demuestre que si A es positiva defi¬ 
nida, entonces A tiene una factorización LU, A = LU, donde U 
tiene pivotes positivos en su diagonal. (Lo contrario también es 
verdadero). 

Si A es de m x n, entonces la matriz G — A T A es la matriz de Gram 
de A. En este caso, las entradas de G son los productos interiores de 
las columnas de A. (Véase los ejercicios 9 y 10). 

9. Demuestre que la matriz de Gram de cualquier matriz A es 
positiva semidefinida, con el mismo rango que A. (Véase los 
ejercicios de la sección 6.5). 

10. Demuestre que si una matriz G de n x n es positiva semidefinida 
y tiene rango r, entonces G es la matriz de Gram de alguna ma¬ 
triz A de r x n. Esto se llama factorización reveladora del rango 
de G. [Sugerencia: Considere la descomposición espectral de G, 
y primero escriba G como BB T para una matriz B de n x r]. 

11. Pruebe que cualquier matriz A de n x n, admite una descomposi¬ 
ción polar de la forma A = PQ, donde P es una matriz positiva 
semidefinida con el mismo rango que A, y donde Q es una ma¬ 
triz ortogonal de n x n. [Sugerencia: Utilice la descomposición 
en valores singulares, A = U%V T , y observe que A = ( U%U T ) 
(UV r )\. Esta descomposición se utiliza, por ejemplo, en inge¬ 
niería mecánica para modelar la deformación de un material. La 
matriz P describe la elongación o compresión del material (en 
las direcciones de los vectores propios de P). y Q describe la 
rotación del material en el espacio. 
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Los ejercicios 12 a 14 se refieren a una matriz A de m x n con una 
descomposición en valores singulares reducida, A = U r DVj, y la 
seudoinversa A + = V r D~ l Uj. 

12. Compruebe las propiedades de A + : 

a) Para toda y en IR'", AA + y es la proyección ortogonal de y 
sobre Col A. 

tí) Para toda x en IR", A + Ax es la proyección ortogonal de x 
sobre Fil A. 

c) AA+A = A y A + AA + = A+- 

13. Suponga que la ecuación Ax = b es consistente, y sea x + = 
A + b. De acuerdo con el ejercicio 23 de la sección 6.3, existe 
exactamente un vector p en Fil A tal que Ap = b. Los siguientes 
pasos prueban que x + = p y x + es la solución de longitud míni¬ 
ma de Ax = b. 

a) Demuestre que x + está en Fil A. [Sugerencia: Escriba b 
como Ax para alguna x, y utilice el ejercicio 12]. 

tí) Demuestre que x + es una solución de Ax = b. 
c) Demuestre que si u es cualquier solución de Ax = b, enton¬ 
ces ||x+|| £ ||u||, con la igualdad solo si u = x + . 


14. Dada cualquier b en IR"', adapte el ejercicio 13 para demostrar 
que A + b es la solución por mínimos cuadrados de longitud mí¬ 
nima. [Sugerencia: Considere la ecuación Ax = b, donde b es 
la proyección ortogonal de b sobre Col A], 

[M] En los ejercicios 15 y 16, construya la seudoinversa de A. 
Comience aplicando un programa de matrices para obtener la DVS 
de A. o, si no tiene un programa de ese tipo, comience con una dia- 
gonalización ortogonal de A T A. Utilice la seudoinversa para resolver 
Ax = b, para b = (6, — 1, —4, 6), y sea x la solución. Haga un cálculo 
para comprobar que x está en Fil A. Encuentre un vector u distinto de 
cero en Nul A, y compruebe que ||x|| < ||x + u||, lo que debe ser cierto 
de acuerdo con el ejercicio 13c). 

3-3-6 6 1' 

1 - 1-1 1 -2 
0 0-1 1-1 

0 0-1 1 - 1 _ 

4 0 -1 -2 0~ 

5 0 3 5 0 

2 0 - 1-2 0 

6 0 -3 -6 0_ 


15. A = 


16. A = 





Geometría de espacios 
vectoriales 


EJEMPLO INTRODUCTORIO 

Los sólidos platónicos 



En la ciudad de Atenas, en el año 387 a. C., el filósofo griego 
Platón fundó una Academia, a la que muchos consideran 
como la primera universidad en el mundo. Aunque ahí 
se estudiaban ciencias como astronomía, biología, teoría 
política y filosofía, el tema fundamental de estudio fue la 
geometría. En efecto, a la entrada de la Academia se leía 
la inscripción: No entre aquí quien no sepa geometría. 

Los griegos quedaron muy impresionados por los 
patrones geométricos, como los sólidos regulares. 

Un poliedro se llama regular si sus caras son polígonos 
regulares congruentes y todos los ángulos en los vértices 
son iguales. Cerca de 150 años antes de Euclides, los 
pitagóricos conocían al menos tres sólidos regulares: 
el tetraedro (4 caras triangulares), el cubo (6 caras 
cuadradas) y el octaedro (8 caras triangulares). (Véase la 
figura 1). Esas formas se presentan de manera natural en 
cristales de minerales comunes. Solo existen cinco de estos 
sólidos regulares; a los ya mencionados hay que añadir el 
dodecaedro (12 caras pentagonales) y el icosaedro (20 caras 
triangulares). 

En el Libro xm de sus Elementos, Platón analizó la 
teoría básica de esos cinco sólidos, y desde entonces se 
les conoce con el nombre de sólidos platónicos. 

Durante siglos no hubo necesidad de considerar objetos 
geométricos de más de tres dimensiones. Pero en la actualidad 


es común que los matemáticos trabajen con objetos en 
espacios vectoriales de cuatro, cinco o incluso cientos de 
dimensiones. No necesariamente son claras las propiedades 
geométricas que pudieran atribuirse a esos objetos de 
grandes dimensiones. 

Por ejemplo, ¿qué propiedades tienen las rectas en espacios 
bidimensionales y los planos en espacios tridimensionales? 
¿Cuáles de esas propiedades podrían ser útiles en mayores 
dimensiones? Las secciones 8.1 y 8.4 presentan algunas 
respuestas. Los hiperplanos de la sección 8.4 serán importantes 
para entender la naturaleza multidimensional de los problemas 
de programación lineal. 

¿A que “se parecería” el análogo de un poliedro en más 
de tres dimensiones? Se obtiene una respuesta parcial con las 
proyecciones bidimensionales del objeto tetradimensional, 
creadas de manera análoga a las proyecciones bidimensionales 
de un objeto tridimensional. La sección 8.5 ilustra esta idea 
para el “cubo” y el “simplejo” de cuatro dimensiones. 

El estudio geométrico en grandes dimensiones no solo 
aporta nuevas formas de visualizar conceptos algebraicos 
abstractos, sino que también genera herramientas aplicables 
en R 3 . Por ejemplo, las secciones 8.2 y 8.6 incluyen aplica¬ 
ciones a gráficos de computadora, y en la sección 8.5 se 
delinea una demostración (en el ejercicio 21) de que en R 3 
solo existen cinco poliedros regulares. 


435 



436 CAPÍTULO 8 Geometría de espacios vectoriales 






FIGURA 1 Los cinco sólidos platónicos. 



En los capítulos anteriores, la mayoría de las aplicaciones implicaron cálculos algebraicos 
con subespacios y combinaciones lineales de vectores. Este capítulo estudia conjuntos de 
vectores que se pueden visualizar como objetos geométricos, segmentos de recta, polígonos 
y objetos sólidos. Los vectores individuales se ven como puntos. Los conceptos que se pre¬ 
sentan en este capítulo se emplean en gráficos de computadora, en programación lineal y en 
otras áreas de matemáticas. 1 

A lo largo del capítulo, los conjuntos de vectores se describen mediante combinaciones 
lineales, pero con diferentes restricciones acerca de los pesos utilizados en dichas combina¬ 
ciones. Por ejemplo, en la sección 8.1, la suma de los pesos es 1, mientras que en la sección 
8.2, los pesos son positivos y suman 1. Desde luego, las visualizaciones son en IR 2 o R 3 , pero 
los conceptos también se aplican a R" y a otros espacios vectoriales. 


8.1 


COMBINACIONES AFINES 


Una combinación afín de vectores es un tipo especial de combinación lineal. Dados los 
vectores (o “puntos”) Vi, V2,..., \ p en R" y los escalares ci,..., c p , una combinación afín 
de vi, V 2 ,..., \ p es una combinación lineal 


ClVi + ••• + CpS p 


tal que los pesos satisfacen c\ + ••• + c p = 1. 


1 Véase Foley, Van Dam, Feiner y Flughes, Computer Graphics-Principles and Practice, 2a. edición (Boston: 
Addison-Wesley, 1996), pp. 1083-1112. Este material también analiza “espacios afines” sin coordenadas. 
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DEFINICIÓN 


El conjunto de todas las combinaciones afines de puntos en un conjunto S es la envol¬ 
vente afín (o el afín generado) de S, y se denota como aff S. 


La envolvente afín de un solo punto vi es justamente el conjunto {vi}, ya que tiene la 
forma ciVi, donde C\ = 1. Es frecuente que la envolvente afín de dos puntos distintos se 
escriba de manera especial. Suponga que y = cqvi + C 2 V 2 con c\ + C 2 = 1. Se escribe t en 
lugar de ci, de manera que ci = 1 — C 2 = 1 — t. Entonces, la envolvente afín de {Vi, V 2 } 
es el conjunto 


y = (1 — í)vi + fv 2 , con t en IR (1) 

Este conjunto de puntos incluye a Vi (cuando t = 0 ) y a V2 (cuando t = 1 ). Si V2 = Vi, entonces 
la ecuación (1) nuevamente describe solo un punto. En otras palabras, (1) describe la recta 
que pasa por Vi y V 2 . Para ver esto, se rescribe (1) en la forma: 

y = Vi + /(V 2 — Vi) = p + fu, con t en R 

donde p es vi y u es V 2 — Vi. El conjunto de todos los múltiplos de u es Gen { u }, la recta que 
pasa por u y por el origen. El hecho de sumar p a cada punto sobre esta recta traslada Gen {u} 
a la recta que pasa por p paralela a la recta que pasa por u y por el origen. Véase la figura 1. 
(Compare esta figura con la número 5 de la sección 1.5). 



La figura 2 utiliza los puntos originales Vi y V 2 , y muestra aff {V], V 2 } como la recta que 
pasa por vi y V 2 . 



Observe que mientras que el punto y en la figura 2 es una combinación afín de vi y V 2 , 
el punto y — vi es igual a f(v 2 — Vi), que es una combinación lineal (de hecho, un múltiplo) 
de V 2 — vi. Esta relación entre y y V - v¡ es válida para cualquier combinación afín de 
puntos, como lo indica el siguiente teorema. 


Un punto y en R" es una combinación afín de vi,..., \ p en R' ! si y solo si y - v¡ es una 
combinación lineal de los puntos trasladados V 2 — Vi,..., \ p — v¡. 


TEOREMA 1 
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DEMOSTRACION Si y - Vi es una combinación lineal de V2 — Vi,..., x p — Vi, entonces 
existen pesos c 2 ,..., c p tales que 


y - Vi = c 2 (v 2 - Vi) H-b c p (v p - Vi) 


( 2 ) 


Luego, 


y=(l-c 2 - c p )v\ -b c 2 v 2 -b- \-c p v p (3) 

y los pesos en esta combinación lineal suman 1. Así, y es una combinación afín de vi,..., \ p . 
A la inversa, suponga que 

y = civi + c 2 v 2 4-b c p x p (4) 


donde <?i + ••• + c p = 1. Como ci = 1 — c 2 — ••• — c p , entonces la ecuación (4) se puede 
escribir como en la ecuación (3), y esto conduce a (2), lo que demuestra que y — Vi es una 
combinación lineal de v 2 — Vi,..., x p — Vi. ■ 


En el enunciado del teorema 1, el punto vi se podría remplazar por cualquier otro punto 
de la lista Vi,. .., x p . En la demostración solo cambiaría la notación. 


EJEMPLO 1 



' 1' 


'2' 


' 1' 


'-2' 


"4" 

Vi = 

2 

, v 2 = 

5 

, v 3 = 

3 

, v 4 = 

2 

y y = 

1 


. Si es 


posible, escriba y como una combinación afín de Vi, v 2 , V3 y V4. 
SOLUCIÓN Se calculan los puntos trasladados 


1 

' 1' 

1 1 

'0' 

1 ¡ 

r-3i 

1 ¡ 

r 3i 

< 

K> 

1 

< 

II 

3 

II 

> 

1 

m 

> 

1 

1 

< 

II 

1 

0 

_1 

II 

> 

1 

1 

7 


Se encuentran los escalares c 2 , C 3 y C 4 tales que 

c 2 (v 2 - vi) + c 3 (v 3 - vi) + c 4 (v 4 - vi) = y - vi (5) 

ahora se reduce por filas la matriz aumentada teniendo estos puntos como columnas: 


■ 1 

0 

-3 3 ' 


' 1 

O 

1 

U> 

3' 

3 

1 

0 - 1 . 


0 

1 9 

-10 


Esto demuestra que la ecuación (5) es consistente, y la solución general es c 2 = 3 c 4 + 3, 
C 3 = — 9 c 4 — 10, con í '4 libre. Cuando C 4 = 0, 

y - Vi = 3 (v 2 - vi) - 10(v 3 - vi) + 0(v 4 - vi) 


y 


y = 8vi + 3 v 2 — 10 v 3 


Como otro ejemplo, se toma C 4 = 1. Entonces, c 2 = 6 y C 3 = —19, así que 
y - vi = 6 (v 2 - vi) - 19(v 3 - vi) + l(v 4 - vi) 


y 

y = 13vi + 6v 2 — 19 v 3 + V4 ■ 

Mientras que el procedimiento del ejemplo 1 funciona para puntos arbitrarios vi, 
v 2 ,..., \ p en IR", la pregunta se puede contestar más directamente si los puntos selecciona¬ 
dos v¡ son una base para IR". Por ejemplo, sea B = {b¡,_, b„¡ dicha base. Entonces cual¬ 

quier y en IR" es una combinación lineal única de bj,..., b„. Esta combinación es una 
combinación afín de las b si y solo si los pesos suman 1. (Estos pesos son justamente las 
¿3-coordenadas de y, como en la sección 4.4). 
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"4” 


"0 


"5 


"2" 


T 

EJEMPLO 2 Sean bi = 

0 

,b 2 = 

4 

, b 3 = 

2 

•Pi = 

0 

y p 2 = 

2 


3 


2 


4 


0 


2 


El conjunto B = {bj, b2, b 3 ¡ es una base para IR 3 . Determine si los puntos pi y P2 son 
combinaciones afines de los puntos en B. 


SOLUCIÓN Encuentre las ^-coordenadas de pi y P2. Estos dos cálculos se pueden combi¬ 
nar reduciendo por filas la matriz [b¡ b2 b 3 p¡ P2], con dos columnas aumentadas: 


"4 

0 

5 

2 

1 " 


1 

0 

0 

-2 

2 

3 

0 

4 

2 

0 

2 


0 

1 

0 

-1 

2 

3 

1 

3 _ 

3 

2 

4 

0 

2 












0 

0 

1 

2 


Lea la columna 4 para construir pi y la columna 5 para construir P 2 : 

p, = - 2 bi - b 2 + 2 b 3 y p 2 = fbi + §b 2 - |b 3 

La suma de los pesos en la combinación lineal para p 3 es —1, no 1, de manera que pi no 
es una combinación afín de las b. Sin embargo, p 3 es una combinación afín de las b porque 
la suma de los pesos para p 3 es 1. ■ 


DEFINICIÓN 


Un conjunto S es afín si p, q e S implica que (1 — í)p + íq e S para todo número 
real t. 


Geométricamente, un conjunto es afín si siempre que dos puntos estén en el conjunto, la 
recta completa que pasa por esos puntos también está en el conjunto. (Si S solamente contiene 
un punto, p, entonces la recta pasa por p y p es justamente un punto, una recta “degenerada”). 
Algebraicamente, para que un conjunto S sea afín, la definición requiere que cada combina¬ 
ción afín de dos puntos de S pertenezca a S. De manera notable, esto es equivalente a pedir 
que S contenga toda combinación afín de un número arbitrario de puntos de S. 


TEOREMA 2 


Un conjunto S es afín si y solo si cada combinación afín de puntos de S está en S. 
Es decir, S es afín si y solo si S = aff S. 


DEMOSTRACIÓN Se supone que S es afín y se utiliza inducción sobre el número m de 
puntos de S que participan en una combinación afín. Cuando m es 1 o 2, una combinación 
afín de m puntos de S se encuentra en S, de acuerdo con la definición de conjunto afín. 
Ahora, se supone que cada combinación afín de k o menos puntos de S conducen a un punto 
en S, y se considera una combinación de k + 1 puntos. Tomemos \¡ en S para i = 1 k + 
1, y sea y = ciVi + ••• + c>V/, + q+iV^+i, donde c¡ + ••• + c^+i = 1- Como las c¡ suman 1, 
al menos una de ellas no debe ser igual a 1. Al reindexar las v ( - y las c„ si es necesario, se 
puede suponer que c k+ 1 A 1. Sea t = c\ + + c k . Entonces t = 1 — c k +\ A 0, y 

y = (1 - C k+ 1 ) Vt H-F Y Vk ) + Ct+tUt+t (6) 

De acuerdo con la hipótesis de inducción, el punto z = (ci/r)V| + ••• + (c k /t)\ k está 

en S, ya que los coeficientes suman 1. De esta forma, (6) presenta a y como una combina¬ 
ción afín de dos puntos en S, y así y e S. De acuerdo con el principio de inducción, cada 
combinación afín de dichos puntos está en S. Es decir, aff S C S. Pero la inclusión inversa, 
S C aff .S', siempre se aplica. Por lo tanto, cuando S es afín, S = aff S. A la inversa, si 

S = aff S, entonces las combinaciones afines de dos (o más) puntos de S están en S, por 

consiguiente, S es afín. ■ 
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DEFINICIÓN 


TEOREMA 3 


La siguiente definición aporta terminología para conjuntos afines que pone de relieve 
su cercana relación con subespacios de R". 


Un traslado de un conjunto S en R" por un vector p es el conjunto S + p = ¡s + 
p : s g 5'}. 2 Un plano afín en R" es un traslado de un subespacio de R". Dos planos 
afines son paralelos si uno es el traslado del otro. La dimensión de un plano afín es la 
dimensión del subespacio paralelo correspondiente. La dimensión de un conjunto S, 
escrito como dim S, es la dimensión del plano afín más pequeño que contiene a S. 
Una recta en R" es un plano afín de dimensión 1. Un hiperplano en R" es un plano 
afín de dimensión n — 1. 


En R 3 , los subespacios propios 3 consisten en el origen 0, el conjunto de todas las líneas 
que pasan por 0, y el conjunto de todos los planos que pasan por 0. Así, los planos afines 
propios en R 3 son puntos (dimensión cero), rectas (unidimensionales) y planos (bidimensio- 
nales), los cuales pueden pasar o no por el origen. 

El siguiente teorema indica que esas descripciones geométricas de rectas y planos en 
R 3 (como traslados de subespacios) en realidad coinciden con sus anteriores descripciones 
algebraicas como conjuntos de todas las combinaciones afines de dos o tres puntos, respec¬ 
tivamente. 


Un conjunto S no vacío es afín si y solo si es un plano afín. 


DEMOSTRACIÓN Supongamos que S es afín. Sea p cualquier punto fijo en S, y W = S + 
(— p), de manera que S = W + p. Para demostrar que S es un plano afín, es suficiente de¬ 
mostrar que W es un subespacio de R". Puesto que p está en S, el vector cero está en W. Para 
demostrar que W es cerrado bajo sumas y múltiplos escalares, basta con probar que si ui y 112 
son elementos de W, entonces + /U2 está en W para cada t real. Como ui y 112 están en W, 
existen Si y S 2 en S tales que U| =s¡ — p y 112 = S 2 p. Así, para cada t real, 

Ui + íu 2 = (Si - p) + t (s 2 - p) 

= (1 — í)sr + í (Si +s 2 -p)-p 

Sea y = Si + S 2 — p. Entonces y es una combinación afín de puntos en S. Como S es afín, 
y está en S (de acuerdo con el teorema 2). Pero entonces (1 — í)si + ty también está en S. 
Así, ui + rii 2 está en — p + S = W. Esto demuestra que W es un subespacio de R". Por lo 
tanto, S es un plano afín, porque S = W + p. 

A la inversa, suponga que S es un plano afín. Es decir, S = W + p para alguna p e R" 
y algún subespacio W. Para probar que S es afín, es suficiente demostrar que para cualquier 
par de puntos Si y S 2 en S, la recta que pasa por Si y S 2 está en S. Por definición de W, existen 
Ui y U 2 en W tales que Si = Ui + p y S 2 = U 2 + p. Así, para cada t real, 

(1 - t )si + ís 2 = (1 - f)(ui + p) + r(u 2 + p) 

= (1 - f)ui + m 2 + p 

Como W es un subespacio, (1 — í)ui + /U 2 e W y así (1 — í)Si + ÍS 2 e W + p = S. Por lo 
tanto, S es afín. ■ 


2 Si p = 0, entonces el traslado es S mismo. Véase la figura 4 de la sección 1.5. 

3 Un subconjunto A de un conjunto B es un subconjunto propio de B si .4 A B. La misma condición se aplica a sub¬ 
espacios propios y planos afines propios en R": no son iguales a IR". 
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El teorema 3 ofrece un enfoque geométrico para la envolvente afín de un conjunto: es 
el plano afín que consiste en todas las combinaciones afines de puntos en el conjunto. Por 
ejemplo, la figura 3 muestra los puntos estudiados en el ejemplo 2 . Aunque el conjunto de 
todas las combinaciones lineales de bi, b2 y b 3 es todo de R 3 , el conjunto de todas las com¬ 
binaciones afines es solamente el plano a través de bi, b2 y b3. Observe que p2 (del ejem¬ 
plo 2 ) está en el plano por bi, b2 y bí, mientras que pi no se encuentra en ese plano. También, 
véase el ejercicio 14. 

El siguiente ejemplo ofrece una mirada renovada a un conjunto familiar: el conjunto de 
todas soluciones de un sistema Ax = b. 


EJEMPLO 3 Suponga que las soluciones de una ecuación Ax = b son todas de la forma 

. De la sección 1.5 recuerde que este con¬ 
junto es paralelo al conjunto solución de Ax = 0, que consiste en todos los puntos de la forma 
x 3 u. Encuentre puntos vi y V 2 tales que el conjunto solución de Ax = b sea aff {Vi, V 2 }. 


x = X311 + p, donde u = 

2“ 

-3 

y p = 

4 " 

0 


1 


-3 


SOLUCIÓN El conjunto solución es una recta que pasa por p en la dirección de u, como 
se muestra en la figura 1. Como aff{V|, V 2 ! es una recta que pasa por Vi y V 2 , identifique 
dos puntos sobre la recta x = x 3 u + p. Se presentan dos sencillas elecciones cuando x 3 = 0 
y x 3 = 1. Es decir, tome vi = p y V2 = u + p, de forma que 


v 2 = u + p = 

1 

<N en 

1 

1 _ 

+ 

4" 

0 

_ 

1 

^0 m 

1 

1_ 


1 


-3 


-2 


En este caso, el conjunto solución se describe como el conjunto de todas las combinaciones 
afines de la forma 


X = (1 - X3) 

4" 

0 

+ X3 

1 

1 

U> Os 

_1 


-3 


-2 


Anteriormente, el teorema 1 reveló una importante conexión entre combinaciones afines y 
combinaciones lineales. El siguiente teorema ofrece otra perspectiva de las combinaciones afi¬ 
nes, que para R 2 y R 3 está cercanamente relacionada con aplicaciones a gráficos generados por 
computadora, como se explicará en la siguiente sección (y como se vio en la sección 2.7). 


DEFINICIÓN 


Para v en R", la forma homogénea estándar de v es el punto v = 


en R" +1 . 


TEOREMA 4 Un punto y en R" es una combinación afín de Vi,..., v p en R" si y solo si la for¬ 
ma homogénea de y está en Gen {vi,..., v ; ,¡. De hecho, y = ciVi + ••• + c p \ p , con 
c\ + ■■■ + c p = 1, si y solo si y = ciVi + ••• + c p \ p . 


DEMOSTRACION Un punto y está en aff {vi,..., v p ) si y solo si existen pesos c 1 ,..., c p 
tales que 


’y" 

1 

= C1 

Vi 

1 

+ Cl 

V2 

1 


' • + Cp 

1 


Esto ocurre si y solo si y se encuentra en Gen {vi, V2,..., \ p }. 



"3 


■ r 


" 1 " 


~ 4~ 

EJEMPLO 4 Seanv 1 = 

1 

, v 2 = 

2 

> V 3 = 

7 

y p = 

3 


1 


2 


1 


0 


. Utilice el teorema 


4 para escribir p como una combinación afín de Vi, V2 y V3, si es posible. 
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SOLUCIÓN Se reduce por fdas la matriz aumentada para la ecuación 

X1V1 + X 2 V 2 + X3V3 = P 

Para simplificar la aritmética, se mueve la cuarta fila de unos hasta arriba (lo que equivale 
a tres intercambios de filas). Después de esto, el número de operaciones aritméticas aquí es 
básicamente el mismo que el número que necesita el método del teorema 1 . 


"1 

1 

1 

r 


" 1 

1 

1 

r 

3 

1 

1 

4 


0 

-2 

-2 

1 

1 

2 

7 

3 


0 

1 

6 

2 

1 

2 

1 

0 


0 

1 

0 

-1 


"1 

0 

0 

1.51 





0 

1 

0 

- 

1 





0 

0 

1 

.5 





0 

0 

0 


0 





De acuerdo con el teorema 4, 1.5 Vi - V 2 + . 5 V 3 = p. Véase la figura 4, que muestra el plano 
que contiene a Vi, V 2 , V 3 y p (junto con los puntos sobre los ejes coordenados). ■ 



PROBLEMA DE PRACTICA 


Dibuje los puntos = 


, y2 = 


-1 

2 


, v 3 = 


y p = 


en un hoja de papel para 


gráficas, y explique por qué p debe ser una combinación afín de vi, V2 y V3. Después, en¬ 
cuentre la combinación afín para p. [Sugerencia: Pregúntese cuál es la dimensión de 
affjvi, v 2 , v 3 }]. 


8.1 EJERCICIOS 

En los ejercicios 1 a 4. escriba y como una combinación afín de los 
otros puntos indicados, si es posible. 



" 1' 


'-2' 


'0' 


' 3 ' 


' 5 " 

Vi = 

2 

, v 2 = 

2 

, v 3 = 

4 

, v 4 = 

1 _ 

-y = 

_ 3 _ 


' 1' 


'-1' 


'3' 

r 

5 " 



Vi = 

1 

, V 2 = 

2 

, v 3 = 

2 

-y = 

7 _ 




< 

II 

'- 3 ' 

1 

, V 2 = 

1 

4^ O 
_1 

, V 3 = 

1 

1 

N> 

_1 

>y = 

' 17" 
1 


1 


L-2 1 


L 6 J 


5 



' 1 ' 


2" 


"4" 


"- 3 " 

4. vi = 

2 

, v 2 = 

-6 

, v 3 = 

3 

>y = 

4 


0 


7 


1 


-4 



"2~ 


1 ' 


2" 

En los ejercicios 5 y 6, sean b t = 

1 

. b 2 = 

0 

1 b 3 = 

-5 


1 


-2 


1 


y 5= {bi, b 2 , b 3 }. Observe que S es una base ortogonal para IR 3 . 
Escriba cada uno de los puntos dados como una combinación afín 
de los puntos del conjunto S , si es posible. [Sugerencia: Para encon¬ 
trar los pesos, aplique el teorema 5 de la sección 6.2 en vez de la 
reducción por filas]. 
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í/l 

p 

y 

11 

1 

00 u> 

_ 1 

b. p 2 = 

6 

-3 

c. p 3 = 

0 " 

-1 


L 4 J 


3 


-5 


6 . a. p! = 

0 “ 

-19 

b. p 2 = 

1 

10 CO 

\ 

1 _ 

c. p 3 = 

5" 

-4 


-5 


L -5 1 


0 


7. Sean 



' 1 " 


2 “ 


"-1 ~ 


0 


-1 


2 

Vi = 

3 

v 2 = 

0 

v 3 = 

1 


0 


4 


1 



5“ 


-9“ 


"4~ 


-3 


10 


2 

Pi = 

5 

P 2 = 

9 

P 3 = 

8 


3 


-13 


5 


y S = ¡vi, V 2 , V 3 }. Es posible demostrar que S es linealmente 
independiente. 

a ) ¿Está pi en Gen 5? ¿Se encuentra pi en aff 5? 

b ) ¿Se encuentra p 2 en Gen 57 ¿Está P 2 en aff 5? 

c) ¿Está P 3 en Gen SI ¿Se encuentra P 3 en aff 5? 


8 . Repita el ejercicio 7 considerando 



1 " 


2~ 


0 


1 

Vi 

3 

, v 2 

6 


_ —2 _ 


_ —5 _ 


4“ 


"-5~ 


-1 


3 

V = 

15 

P = 

-8 


-7 


6 


v 3 


3 

0 

12 

-6 


y p 3 = 


1 

6 

—6 


9. Suponga que las soluciones de una ecuación Ax = b son to- 


b) Si {bi,..., bjt) es un subconjunto linealmente independiente 
de IR" y si p es una combinación lineal de bi,..., b*-, entonces 
p es una combinación afín de bi,..., b¿. 

c) La envolvente afín de dos puntos distintos se llama recta. 

d ) Un plano afín es un subespacio. 

e) El plano en IR 3 es un hiperplano. 

12. a) Si S = {xj, entonces aff S es el conjunto vacío. 

b) Un conjunto es afín si y solo si contiene su envolvente afín. 

c) Un plano afín de dimensión 1 se llama recta. 

d) Un plano afín de dimensión 2 se llama hiperplano. 

e) Un plano afín que pasa por el origen es un subespacio. 

13. Suponga que {vi, V 2 , v 3 } es una base para IR 3 . Demuestre que 
Gen {V 2 — vi, v 3 — Vi} es un plano en IR 3 . [Sugerencia: Piense 
qué se puede decir sobre u y v cuando Gen {u, vj es un plano]. 

14. Demuestre que si {vi, V 2 . v 3 ] es una base para IR 3 , entonces 
aff {vi, V 2 , v 3 ] es el plano a través de Vi, V 2 y v 3 . 

15. Sea A una matriz de m x n y, si b está en IR m , demuestre que el 
conjunto S de todas las soluciones de Ax = b es un subconjunto 
afín de R". 

16. Considere que v e IR" y k e R. Demuestre que 5 = {x e IR" : 
xv = k } es un subconjunto afín de IR". 

17. Seleccione un conjunto S de tres puntos tales que aff S sea el 
plano en IR 3 cuya ecuación es *3 = 5. Justifique su trabajo. 

18. Seleccione un conjunto S de cuatro puntos distintos en IR 3 
tal que aff S sea el plano 2x¡ + X 2 — 3 x 3 = 12. Justifique su 
trabajo. 

19. Sea S un subconjunto afín de IR", y suponga que /: IR" —» IR'" 
es una transformación lineal, y que f(S) denota el conjunto de 
imágenes {/(x): xeS}. Demuestre que f(S) es un subconjunto 
afín de IR" 1 . 

20. Sean / : IR" —» IR"' una transformación lineal, T un subcon¬ 
junto afín de R'", y S = {x e IR” : /(x) e T\. Demuestre que S 
es un subconjunto afín de R". 


das de la forma x = X 311 + p, donde u = 



Encuentre los puntos Vi y V 2 tales que el conjunto solución de 
Ax = b seaaff{vi, V2}. 

10. Suponga que las soluciones de una ecuación Ax = b son todas 



5“ 


1 “ 

de la forma x = x 3 u + p. donde u = 

1 

-2 

y p = 

-3 

4 


Obtenga puntos v 3 y v 2 tales que el conjunto solución de 
Ax = b sea aff{vi, V2}. 


En los ejercicios 11 y 12, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. 

11. a) El conjunto de todas las combinaciones afines de puntos en 
un conjunto S se denomina envolvente afín de S. 


En los ejercicios 21a 26, demuestre el enunciado sobre subconjuntos 

A y 6 de IR", o dé el ejemplo requerido en IR 2 . Una demostración para 

un ejercicio puede utilizar los resultados obtenidos en los ejercicios 

anteriores (así como los teoremas disponibles en el libro). 

21. Si A C B y B es afín, entonces aff A C B. 

22. Si A C B, entonces aff A C aff B. 

23. [(aff A) U (aff 6 )] C aff (A U B). [Sugerencia: Para demostrar 
que D U £c F, demuestre que D C F y E C F¡. 

24. Encuentre un ejemplo en IR 2 para demostrar que la igualdad 
no necesariamente es válida en el enunciado del ejercicio 23. 
[Sugerencia: Considere los conjuntos Ay B, cada uno los cuales 
solamente contiene uno o dos puntos], 

25. aff (A n B) C (aff A n aff B) 

26. Encuentre un ejemplo en IR 2 para demostrar que la igualdad no 
necesita ser válida en el enunciado del ejercicio 25. 
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SOLUCIÓN AL PROBLEMA DE PRÁCTICA 



Como los puntos Vi, V 2 y V 3 no son colineales (es decir, no están sobre una recta), aff {vi, 
V 2 , V 3 } no puede ser unidimensional. Por lo tanto, aff {Vi, V 2 , V 3 } debe ser igual a IR 2 . 
Para encontrar los pesos reales utilizados para expresar p como una combinación afín de 
Vi, V 2 y V 3 , primero calcule 


X 1 

'-2' 


'2' 


"3' 

II 

> 

1 

Cd 

2 

, V 3 - V! = 

1 

y p - vi = 

3 


Para escribir p — Vi como una combinación lineal de V 2 — vi y V 3 — Vi, se reduce por filas 
la matriz que tiene estos puntos como columnas: 


-2 2 

2 1 



1 

2 


2 


Así, p — vi = i(v 2 — vi) + 2 (v 3 — vi), lo que muestra que 


p = (l - \ ~ 2) Vi + ±v 2 + 2 v 3 = — § Vi + 5V2 + 2 v 3 


Esto expresa p como una combinación afín de vi, V2 y V3, porque los coeficientes suman 1. 
Alternativamente, utilice el método del ejemplo 3 y reduzca por filas: 


ioo-¡ 
0 1 0 i 
0 0 12 

Esto demuestra que p = — |v¡ + jV 2 + 2 v 3 . 


Vi v 2 v 3 p 
lili 


1 1 1 
1 -1 3 

0 2 1 


8.2 INDEPENDENCIA AFÍN 


En esta sección se continuará explorando la relación entre conceptos lineales y conceptos 
afines. Primero considere un conjunto de tres vectores en R 3 , por ejemplo, S = {v¡, V 2 , V 3 }. 
Si S es linealmente dependiente, entonces uno de los vectores es una combinación lineal de 
los otros dos vectores. ¿Qué ocurre cuando uno de los vectores es una combinación afín 
de los otros? Por ejemplo, suponga que 

V 3 = (1 — f)vi + ív 2 , para alguna 1 en R. 


Entonces, 


(1 - í)vi + t \2 ~ V 3 = 0 


Esta es una relación de dependencia lineal ya que no todos los pesos son cero. Pero hay algo 
más que es verdad: los pesos en la relación de dependencia suman cero: 

(1 — t) + t + (— 1 ) = 0 

Esta es la propiedad adicional necesaria para definir dependencia afín. 


DEFINICION Un conjunto indexado de puntos {Vi,. .., v ;) } en R" es afínmente dependiente si existen 
números reales cj,..., c p , no todos cero, tales que 

c\ + ■■■ + c p = 0 y C 1 V 1 + ••• + c p \ p = 0 

De lo contrario, será afínmente independiente. 


( 1 ) 
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TEOREMA 5 


Una combinación afín es un tipo especial de combinación lineal, y la dependencia afín es 
un tipo restringido de dependencia lineal. Por lo tanto, cada conjunto afínmente dependiente 
es, de manera automática, linealmente dependiente. 

Un conjunto {vi} de solo un punto (aun el vector cero) debe ser afínmente independiente 
porque las propiedades requeridas de los coeficientes c¡ no se pueden satisfacer cuando solo 
existe un coeficiente. Para {vi}, la primera ecuación en (1) es justamente c\ = 0, y al menos 
un coeficiente (el único) debe ser distinto de cero. 

En el ejercicio 13 se le pide demostrar que un conjunto indexado {vi, V 2 ¡ es afínmente 
dependiente si y solo si vi = V 2 . El siguiente teorema trata el caso general y muestra cómo el 
concepto de dependencia afín es análogo al de dependencia lineal. Los incisos c) y d) brindan 
métodos útiles para determinar si un conjunto es afínmente dependiente. De la sección 8.1, 
recuerde que si v está en R", entonces el vector v en R" +1 denota la forma homogénea de v. 


Dado un conjunto indexado S = {vi,..., v ; ,} en R", con p > 2, los siguientes enuncia¬ 
dos son lógicamente equivalentes. Es decir, todos ellos son verdaderos o todos son 
falsos. 

á) S es afínmente dependiente. 

b ) Uno de los puntos en S es una combinación afín de los demás puntos en S. 

c) El conjunto {V 2 — Vi,..., v ;) — Vi} en R' ! es linealmente dependiente. 

d) El conjunto {Vi,_, } de formas homogéneas en R' ,+1 es linealmente depen¬ 

diente. 


DEMOSTRACIÓN Suponga que el enunciado a) es verdadero, y sea que Ci,..., c p satisfagan 
(1). Al renombrar los puntos en caso necesario, se puede suponer que cq A 0 y dividir ambas 
ecuaciones en (1) entre C\, de manera que 1 + (C2/C1) + • • • + (c p /c\) = 0 y 

vi = (-c 2 /ci)v 2 +-h (-c p /ci)\ p (2) 

Observe que los coeficientes en el lado derecho de (2) suman 1. Así, a) implica b). Ahora, 
suponga que b) es verdadero. Al renombrar los puntos en caso necesario, se puede suponer 
que vi = C2V2 + • • • + c p Y p , donde C2 + ••• + c p = 1. Entonces, 


(c 2 -1-H £>)vi = c 2 v 2 -I-h c p \ p (3) 

y 

C 2 (V2-Vi) +-f Cp(\p — Vi) = 0 (4) 

No todos los coeficientes c 2 ,..., c p pueden ser cero porque suman 1. Así, b) implica c). 

Ahora si c) es verdadero, entonces existen pesos c 2 ,..., c p , no todos cero, tales que la 
ecuación (4) se cumple. Se rescribe (4) como (3) y se establece = — (c 2 + • •• + c p ). Enton¬ 
ces, ci + ••• + c p = 0. Así, (3) muestra que (1) es verdadera. Por lo que c) implica a), lo que 
prueba que a), b) y c) son lógicamente equivalentes. Por último, d) es equivalente a a) por¬ 
que las dos ecuaciones en (1) son equivalentes a la siguiente ecuación que implica las formas 
homogéneas de los puntos en S: 



Vi 


Yp 


0" 

Ci 

1 

+ • • • + Cp 

1 

— 

0 


En el enunciado c) del teorema 5, vi se podría remplazar por cualquiera de los otros pun¬ 
tos en la lista Vi,..., \ p . En la demostración, solo cambiaría la notación. Así, para determinar 
si un conjunto es afínmente dependiente, se resta un punto en el conjunto de los demás pun¬ 
tos, y se comprueba si el conjunto trasladado de p — 1 puntos es linealmente dependiente. 
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EJEMPLO 1 La envolvente afín de dos distintos puntos p y q es una recta. Si un tercer 
punto r está sobre la recta, entonces {p, q, r¡ es un conjunto afínmente dependiente. Si un pun¬ 
to s no está sobre la recta que pasa por p y q, entonces esos tres puntos no son colineales y 
íp, es un conjunto afínmente independiente. Véase la figura 1. ■ 


aff{p,q} 


FIGURA 1 jp, q, r) es afínmente dependiente. 



T 


r 2 ~ 


"0" 

EJEMPLO 2 Sean\q = 

3 

, v 2 = 

7 

, v 3 = 

4 


7 


6.5 


7 


{V[, V2, V3}. Determine 


si S es afínmente independiente. 



1 


~-l~ 

SOLUCIÓN Se calcula V2 — Vi = 

4 

y V 3 - Vi = 

1 


-.5 


0 


. Esos dos puntos no son 


múltiplos, así que forman un conjunto linealmente independiente, S'. De manera que son 
falsos todos los enunciados del teorema 5, y S es afínmente independiente. La figura 2 
muestra a S y al conjunto trasladado S 1 . Observe que Gen S ' es un plano que pasa por el ori¬ 
gen y aff S es un plano paralelo que pasa por Vi, V2 y V3. (Desde luego, aquí solo se muestra 
una parte de cada plano). ■ 


*3 



FIGURA 2 Un conjunto ¡vi, V2, V3} afínmente 
independiente. 


EJEMPLO 3 Sean vi = 

T 

3 

, v 2 = 

" 2 ” 
7 

, v 3 = 

~0~ 

4 

II 

> 

0" 

14 


7 


6.5 


7 


6 


S = {vi,_, V4}. ¿S es afínmente dependiente? 


SOLUCIÓN Se calcula V 2 — Vi = 

r 

4 

, v 3 - Vi = 

"-1 " 
1 

y v 4 - vi = 

~-r 

11 


-.5 


0 


-1 


reduce por filas la matriz: 


1 

-1 

- 1 " 


" 1 

-1 

- 1 " 


" 1 

-1 

-1" 

4 

1 

11 


0 

5 

15 


0 

5 

15 

-.5 

0 

-1 


0 

-.5 

-1.5 


0 

0 

0 


Recuerde, de la sección 4.6 (o de la sección 2.8) que las columnas son linealmente depen¬ 
dientes porque no toda columna es una columna pivote; así que V 2 — Vi, V 3 — v¡ y V 4 — vi 
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TEOREMA 6 


DEFINICIÓN 


son linealmente dependientes. De acuerdo con el enunciado c) del teorema 5 , {Vi, \ 2 , V3, V4} 
es afínmente dependiente. Esta dependencia también se puede establecer empleando el inciso 
d) del teorema 5 en vez del c). ■ 

Los cálculos del ejemplo 3 muestran que V4 — vi es una combinación lineal de V2 — Vj 
y V3 — Vi, lo que significa que V4 — Vi está en Gen {V2 — Vi, V3 — Vi¡. De acuerdo con el 
teorema 1 de la sección 8 . 1 , V4 se encuentra en aff ¡vi, V2, V3}. De hecho, si en el ejemplo 3 
se completara la reducción por filas de la matriz se mostraría que 

v 4 - Vi = 2 (v 2 - vi) + 3 (v 3 - vi) (5) 

V 4 = —4vi + 2v 2 + 3v3 ( 6 ) 


Véase la figura 3. 



FIGURA 3 V4 está en el plano aff {vi, V2, V3}. 

La figura 3 muestra rejillas sobre Gen{v 2 — Vi, V3 — vi} y aff[v¡, V2, V3¡. La rejilla 
sobre aff ¡vi, V 2 , V 3 ¡ se basa en la ecuación (5). Otro “sistema de coordenadas” se puede 
basar en la ecuación (6), en la cual los coeficientes —4, 2 y 3 son las coordenadas afines 
o baricéntricas de V4. 

Coordenadas baricéntricas 

La definición de coordenadas baricéntricas depende de la siguiente versión afín del teorema 
de representación única de la sección 4.4. Para la demostración, véase el ejercicio 17 de esta 
sección. 


Sea S = {v 1,..., V/< | un conjunto afínmente independiente en R". Entonces, cada p en 
aff S tiene una única representación como una combinación afín de Vi,..., V/,. Es decir, 
para cada p existe un único conjunto de escalares ci,..., c¡ : tales que 

p = C 1 V 1 + ••• + c k \ k y ci + ••• + c k = 1 (7) 


Sea S = {vi,..., va} un conjunto afínmente independiente. Así, para cada punto p en 
aff S, los coeficientes Ci,..., c p en la representación única (7) de p son las coordena¬ 
das baricéntricas (que, en ocasiones, también se conocen como coordenadas afines) 
de p. 


Observe que (7) es equivalente a la ecuación 

VA 
1 


= C t 


Vi 

1 


+ • • • + c k 


( 8 ) 


que implica las formas homogéneas de los puntos. La reducción por filas de la matriz aumen¬ 
tada [vi ••• va p] para (8) produce las coordenadas baricéntricas de p. 
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EJEMPLO 4 Sean a 


, b 


, c 


y p 


Encuentre las coorde¬ 


nadas baricéntricas de p determinadas por el conjunto afínmente independiente ¡a, b, c}. 

SOLUCIÓN Reduzca por fdas la matriz aumentada de puntos en forma homogénea, movien¬ 
do la última fila de unos hacia la parte superior para así simplificar la aritmética: 


á b c p]= 

1 

7 

3 9 5 

0 3 3 


"i i i r 

13 9 5 


1 

1 1 1 


7 0 3 3 


i 

4 

i 

3 

_ 5 ^ 

12 


Las coordenadas son \ ^ y de manera que p 


\ a +\ h +T2 C - 


Las coordenadas baricéntricas tienen interpretaciones físicas y geométricas. Original¬ 
mente, A. F. Moebius las definió en 1827 para un punto p dentro de una región triangular con 
vértices a, b y c. Moebius escribió que las coordenadas baricéntricas de p son tres números 
no negativos m b y m c tales que p es el centro de masa de un sistema que consiste en el 
triángulo (sin masa) y las masas m a , m b y m c en los vértices correspondientes. Las masas están 
unívocamente determinadas al requerir que su suma sea 1. Este punto de vista es útil en la 
física actual. 1 

La figura 4 da una interpretación geométrica a las coordenadas baricéntricas del 
ejemplo 4, al mostrar el triángulo Aabc y tres pequeños triángulos Apbc, Aapc y Aabp. 
Las áreas de los pequeños triángulos son proporcionales a las coordenadas baricéntricas 
de p. En efecto, 

1 

área(Apbc) = - • área(Aabc) 

1 

área(Aapc) = - • área(Aabc) (9) 

5 

área(Aabp) = — • área(Aabc) 


a 



FIGURA 4 p = ra + ib + te. Aquí, r — 



En los ejercicios 21 a 23 se comprueban las fórmulas de la figura 4. Las igualdades 
análogas para volúmenes de tetraedros son válidas para el caso en que p es un punto dentro 
de un tetraedro en R 3 , con vértices en a, b, c y d. 


1 Véase el ejercicio 29 de la sección 1.3. En astronomía, sin embargo, el término “coordenadas baricéntricas” por lo 
general se refiere a las coordenadas ordinarias de puntos en [R 3 y que ahora se conoce como Sistema de referencia 
celeste internacional , un sistema de coordenadas cartesianas para el espacio exterior, con el origen en el centro de 
masa (el baricentro) del Sistema Solar. 
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Cuando un punto no está dentro del triángulo (o del tetraedro), algunas o todas las coor¬ 
denadas baricéntricas serán negativas. En la figura 5 se ilustra el caso de un triángulo, para 
los vértices a, b, c, y los valores coordenados anteriores r, s, t. Por ejemplo, los puntos so¬ 
bre la recta que pasa por b y c tienen r = 0 porque son combinaciones afines solamente de b 
y c. La recta paralela que pasa por a identifica los puntos con r = 1 . 


v ^ 



FIGURA 5 Coordenadas baricéntricas 
para puntos en aff ¡a, b, c}. 


Coordenadas baricéntricas en gráficos generados 
por computadora 

Cuando un diseñador trabaja con objetos geométricos en un programa de generación de gráfi¬ 
cos, puede utilizar una aproximación de “malla de alambre” para un objeto en ciertos puntos 
clave durante el proceso con la finalidad de crear una imagen final realista. 2 Por ejemplo, si la 
superficie de una parte del objeto consiste en pequeñas superficies triangulares planas, enton¬ 
ces el programa de gráficos fácilmente puede agregar color, iluminación y sombreado a cada 
pequeña superficie cuando solo se conoce esa información en los vértices. Las coordenadas 
baricéntricas ofrecen la herramienta para interpolar suavemente la información de los vértices 
hacia el interior de un triángulo. La interpolación en un punto es simplemente la combinación 
lineal de los valores en los vértices utilizando como pesos las coordenadas baricéntricas. 

Con frecuencia, los colores en un monitor de computadora se describen mediante las 
coordenadas RGB. Una terna ( r , g, b) indica la cantidad de cada color (rojo, verde y azul) 
con parámetros que varían de 0 a 1. Por ejemplo, rojo puro es (1, 0, 0), blanco es (1, 1, 1) y 
negro es (0, 0, 0). 



"3" 


”4' 


T 


3 

EJEMPLO 5 Sean vi = 

1 

, y 2 = 

3 

, v 3 = 

5 

y p = 

3 


5 


4 


1 


3.5 


. Los colores en 


los vértices vi, \2 y V 3 de un triángulo son magenta (LO, 1), magenta claro (1, .4, 1) y púrpura 
(. 6 , 0, 1), respectivamente. Encuentre el color interpolado en p. Véase la figura 6 . 



2 El ejemplo introductorio del capítulo 2 menciona un modelo de alambre para un avión Boeing 777, empleado para 
visualizar el flujo de aire sobre la superficie de la aeronave. 
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SOLUCIÓN Primero, determine las coordenadas baricéntricas de p. Aquí se presenta el 
cálculo utilizando las formas homogéneas de los puntos; el primer paso consiste en mover 
la fila 4 a la fila 1: 


1 

1 

1 

1 


" 1 

0 

0 

.25" 

3 

4 

1 

3 


0 

1 

0 

.50 

1 

3 

5 

3 


0 

0 

1 

.25 

5 

4 

1 

3.5 


0 

0 

0 

0 ^ 


Así, p = ,25vi + .5 v2 + .25v 3. Utilice las coordenadas baricéntricas de p para hacer una 
combinación lineal de los datos de color. Los valores RGB para p son 



1 


' 1 


".6 


".9 

rojo 

.25 

0 

+ .50 

.4 

+ .25 

0 

= 

.2 

verde ■ 


1 


1 


1 


1 

azul 


Uno de los últimos pasos en la preparación de la escena gráfica para mostrarla en el mo¬ 
nitor consiste en eliminar las “superficies ocultas” que no deberían ser visibles en la pantalla. 
Imagine que la pantalla de visualización está formada por un millón de pixeles, y considere 
un rayo o una “línea de visión” desde el ojo del observador hacia un pixel y la colección de 
objetos que forman la escena 3D. El color y el resto de la información que se muestra en el 
pixel sobre el monitor deberían provenir del primer objeto sobre el que incide el rayo. Véase 
la figura 7. Cuando los objetos en la escena gráfica se aproximan por mallas de alambre con 
parches triangulares, el problema de la superficie oculta se puede resolver empleando coor¬ 
denadas baricéntricas. 



FIGURA 7 Un rayo proveniente del ojo cruza la 
pantalla hacia el objeto más cercano. 


También es posible utilizar matemáticas para encontrar las intersecciones del triángulo 
de rayos para realizar sombreados extremadamente realistas de objetos. Actualmente, este 
método de trazado de rayos es muy lento para trabajos en tiempo real, pero esto podría cam¬ 
biar en el futuro gracias a recientes avances en implementaciones de hardware. 3 

EJEMPLO 6 Sean 



1 " 


8 


5 


0 


.7" 

Vi = 

1 

, v 2 = 

1 

, v 3 = 

11 

, a = 

0 

, b = 

.4 


-6 


-4 


-2 


10 


-3 


y x(í) = a + fb para t > 0. Determine el punto donde el rayo x(f) se interseca con el plano que 
contiene el triángulo con vértices vi, V2 y V3. ¿Este punto se encuentra dentro del triángulo? 


3 Véase Joshua Fender y Jonathan Rose, “A High-Speed Ray Tracing Engine Built on a Field-Programmable System”, 
en Proc. Int. Conf. on Field-Programmable Technology, IEEE (2003). (Un solo procesador puede calcular 600 millo¬ 
nes de intersecciones de triángulos de rayos por segundo). 
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SOLUCIÓN El plano es aff {vi, y 2 , V 3 ¡. Un punto típico en este plano se puede escribir como 
(1 — C2 — C3)vi + C2V2 + C3V3 para algunos C2 y C3. (En esta combinación los pesos suman 1). 
El rayo x(f) hace intersección con el plano cuando C 2 , C 3 y t satisfacen 

(1 —c 2 — c 3 )vi + c 2 v 2 + C3V3 = a + ib 


Reacomode esto como C2(v2 — vi) + C3(v3 — Vi) + t(— b) = a — vi. En forma matricial. 


[ v 2 - Vi v 3 — Vi 


-b] 


C2 

C3 

t 


a — vi 


Para los puntos específicos dados aquí, 



" 7 " 


4 " 


"-l" 

v 2 - Vi = 

0 

. v 3 - Vi = 

10 

, a - vi = 

-1 


2 


4 


16 


La reducción por filas de la matriz aumentada anterior produce 


"7 

4 

-.7 

-1 " 


" 1 

0 

0 

. 3 " 

0 

10 

-.4 

-1 

~ 

0 

1 

0 

.1 

2 

4 

3 

16 


0 

0 

1 

5 


Así, C 2 = .3, C 3 = .1, y t = 5. Por lo tanto, el punto de intersección es 


x( 5 ) = a + 5 b = 


0 


.7 


3 . 5 " 

0 

+ 5 

.4 

= 

2.0 

10 


-3 


- 5.0 


Además, 


x( 5 ) = (1 - .3 - ,l)vi + . 3 v 2 + .lv 3 


r 


8 


5 


3 . 5 " 

1 

+ .3 

1 

+ .1 

11 

= 

2.0 

-6 


-4 


-2 


- 5.0 


El punto de intersección está dentro del triángulo porque todos los pesos baricéntricos para 
x(5) son positivos. ■ 


PROBLEMAS DE PRÁCTICA 


1. Describa un método rápido para determinar cuándo tres puntos son colineales. 


2 . 


Los puntos vi 



" 4 " 


"1" 


' 5 ' 


T 

Vi = 

1 

, v 2 = 

0 

, v 3 = 

4 

y v 4 = 

2 


forman un conjunto afín- 


mente dependiente. Encuentre los pesos ci,..., C 4 que produzcan una relación de depen¬ 
dencia afín C1V1 + ••• + C4V4 = 0 , donde ci + ••• + C 4 = 0, pero no todas las c, son ceros. 
[Sugerencia: Véase el final de la demostración del teorema 5], 
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8.2 EJERCICIOS 


En los ejercicios 1 a 6, determine si el conjunto de puntos es afínmen- 
te dependiente. (Véase el problema de práctica 2). Si es así, entonces 
construya una relación de dependencia afín para los puntos. 





1' 


" —2 " 


2" 


0~ 

3. 

2 

, 

-4 


-1 


15 


-1 


8 


11 


-9 


"-2" 


0" 


1 ' 


'-2' 

4. 

5 

, 

-3 


-2 


7 


3 


7 


-6 


-3 


1— _i 

1 " 


"0~ 

—i 

1— 

'-1 " 

—l 

l— 

0“ 

—i 

0 

, 

1 


5 

, 

5 


-2 


1 


1 


-3 




' 1 _ 


0" 


~2~ 


"3~ 

6 . 

3 


-1 


5 

, 

5 


1 


-2 


2 


0 


En los ejercicios 7 y 8, encuentre las coordenadas baricéntricas de 
p con respecto al conjunto de puntos afínmente independiente que 
lo precede. 


1 ' 


"2" 


1 ' 


5' 

-1 


1 


2 


4 

2 

’ 

0 

’ 

-2 

,P = 

-2 

1 


1 


°_ 


2 

0" 


' 1 ' 


r 


'-1 ' 

1 


1 


4 


1 

-2 

> 

0 

’ 

-6 

,P = 

-4 

1 


2 


5 


0 


En los ejercicios 9 y 10 , marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. 

9 . a) Si Vi,..., v^ están en IR" y si el conjunto {vi — v 2 , v 3 — v 2 ,..., 
v p — V2} es linealmente dependiente, entonces ¡vi,..., v,,} es 
afínmente dependiente. (Lea esto con sumo cuidado). 

b) Si vi,..., x p están en IR" y si el conjunto de formas homo¬ 
géneas {vi,.... v,,} en IR" +1 es linealmente independiente, 
entonces {Vi,..., v p } es afínmente dependiente. 

c) Un conjunto finito de puntos {vi,..., Vr} es afínmente de¬ 
pendiente si existen números reales c \,..., c*, no todos ceros, 
tales que + • • • + ci¡ = 1 y cqvi + ■ • • + c^Xk — 0. 

d) Si S = {vi,..., Vp} en IR" es afínmente independiente y si p 
en IR" tiene una coordenada baricéntrica negativa determi¬ 
nada por S , entonces p no está en aff S. 

e) Si Vi, V2, V3, a y b están en IR 3 y si un rayo a + ?b para (SO 
se interseca con el triángulo de vértices vi, V2 y V3, entonces 
todas las coordenadas baricéntricas del punto de intersec¬ 
ción son no negativas. 

10 . a) Si (vi,..., Vp} en IR" es un conjunto afínmente dependiente, 
entonces el conjunto {vi,..., Vp} en IR" +1 de formas homo¬ 
géneas puede ser linealmente independiente. 


b) Si Vi, V2, V3 y V4 están en IR 3 y si el conjunto {V2 — Vi, 
V3 — Vi, V4 — Vi} es linealmente independiente, entonces 
¡Vi,..., V4} es afínmente independiente. 

c) Dado S = {bi,..., bjj en IR", cada p en aff S tiene represen¬ 
tación única como una combinación afín de bi,..., bk- 

d) Cuando una información de color se especifica en cada vér¬ 
tice vi, V2, V3 de un triángulo en IR 3 , entonces el color se 
puede interpolar en un punto p en aff {vi, V2, V3) emplean¬ 
do las coordenadas baricéntricas de p. 

e) Si T es un triángulo en IR 2 y si un punto p está sobre una 
arista del triángulo, entonces no todas las coordenadas bari¬ 
céntricas de p (para este triángulo) son positivas. 

11. Explique por qué cualquier conjunto de cinco o más puntos en 
IR 3 debe tener dependencia afín. 

12. Demuestre que un conjunto ¡Vi,..., x p } en IR" es afínmente de¬ 
pendiente cuando + 2. 

13. Utilice sólo la definición de dependencia afín para demostrar 
que un conjunto indexado {vi, V2} en IR" es afínmente depen¬ 
diente si y solo si vi = V2. 

14. Las condiciones para dependencia afín son más estrictas que 
para dependencia lineal, así que un conjunto afínmente de¬ 
pendiente, de manera automática, es linealmente dependien¬ 
te. Además, un conjunto linealmente independiente no puede 
ser afínmente dependiente y, por lo tanto, debe ser afínmente 
independiente. Construya dos conjuntos indexados linealmen¬ 
te dependientes Si y SS en IR 2 tales que Si y S2 tengan depen¬ 
dencia e independencia afines, respectivamente. En cada caso, 
el conjunto deberá contener uno. dos o tres puntos diferentes 
de cero. 


15. Sean 



"-1' 


"0" 


"2" 

Vi = 

2 

, v 2 = 

4 _ 

, v 3 = 

0 


¡vi, v 2 , v 3 }. 

a) Demuestre que el conjunto S es afínmente independiente. 

r 2 

b) Encuentre las coordenadas baricéntricas de p, = 



" 1 ' 


--2" 


r 1 ' 


" 1 " 

p 2 = 

2 

• P 3 = 

1 

• P 4 = 

-1 

y p 5 = 

1 


respecto a S. 

c) Sea T el triángulo con vértices vi, V2 y V3. Cuando se ex¬ 
tienden los lados de T, las rectas dividen IR 2 en siete re¬ 
giones. Véase la figura 8 . Observe los signos de las coor¬ 
denadas baricéntricas de los puntos en cada región. Por 
ejemplo, P 5 está dentro del triángulo T y todas sus coorde¬ 
nadas baricéntricas son positivas. El punto pi tiene coor¬ 
denadas ( —, +. +). Su tercera coordenada es positiva 
porque pi está sobre el lado V 3 de la recta que pasa por v¡ 
y V 2 . Su primera coordenada es negativa porque pi es opues¬ 
to al lado vi de la recta que pasa por V2 y V3. El punto p 2 está 
sobre la arista V2V3 de T. Sus coordenadas son (0, +. +). 
Sin calcular los valores reales, determine los signos de las 
coordenadas baricéntricas de los puntos p 6 , P 7 y pg que se 
muestran en la figura 8 . 
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FIGURA 8 


"0" 


" 1 " 


" 4 " 


" 3 " 

1 

, V 2 = 

5 

, v 3 = 

3 

. Pi = 

5 



' 5 ' 



' 2 ' 


- 1 " 


" 0 " 

P 2 = 

1 

. Ps 


3 

. P4 = 

0 

. Ps = 

4 

Ps = 

" 1 ' 

2 

Vi = 

' 6 " 

4 

y S= {vi, v 2 , v 3 ). 




a) Demuestre que el conjunto S es afínmente independiente. 

tí) Encuentre las coordenadas baricéntricas de pi, P 2 y P 3 con 
respecto a S. 

c) En papel milimétrico trace el triángulo T con vértices vi, V 2 
y V3, extienda los lados como en la figura 5 , y trace los pun¬ 
tos P4, p5, pe y P7. Sin calcular los valores reales, determine 
los signos de las coordenadas baricéntricas de los puntos P 4 , 
Ps. Pe y P? 


17. Demuestre el teorema 6 para un conjunto afínmente indepen¬ 
diente S — {vi,..., Vjt) en IR”. [Sugerencia: Un método es imitar 
la demostración del teorema 7 de la sección 4.4], 


18 . Sea T un tetraedro en posición “estándar”, con tres aristas a lo 
largo de los tres ejes coordenados positivos en R 3 , y suponga 
que los vértices son at\, be 2 , ce 3 y 0 , donde [ej e 2 63 ] = 1 3 . 
Obtenga las fórmulas para las coordenadas baricéntricas de un 
punto arbitrario p en R 3 . 


19. Sean { pi , P 2 , P 3 } un conjunto de puntos en R" afínmente de¬ 
pendiente y /: R" —» R"' una transformación lineal. Demuestre 
que {/(pi), /(P2). /(P3)} es afínmente dependiente en R m . 

20. Suponga que ¡pi, P2, P3 } es un conjunto afínmente indepen¬ 
diente en R" y que q es un punto arbitrario en R". Demuestre 
que el conjunto trasladado {pi + q, P2 + q. P3 + ql también es 
afínmente independiente. 

En los ejercicios 21a 24, a, b y c son puntos no colineales en R 2 
y p es cualquier otro punto en R 2 . Sea que Aabc denote la región 
triangular cerrada determinada por a, b y c, y sea Apbc la región de¬ 
terminada por p, b y c. Por conveniencia, suponga que a, b y c se 
arreglan de tal forma que det [ á b c ] es positivo, donde á, b y c 
son las formas homogéneas estándar de los puntos. 

21. Demuestre que el área de Aabc es det[á b c]/2. [Suge¬ 
rencia: Consulte las secciones 3.2 y 3.3, incluyendo los ejer¬ 
cicios], 

22. Sea p un punto sobre la recta que pasa por a y b. Demuestre que 
det [ á b p ] = 0. 

23. Sea p cualquier punto interior de Aabc, con coordenadas bari¬ 
céntricas (r, s, t), de manera que 




b 



= P 


Utilice el ejercicio 19 y un hecho relacionado con determinantes 
(capítulo 3 ) para demostrar que 

r = (área de Apbc)/(área de Aabc) 
s = (área de Aapc)/(área de Aabc) 
t = (área de Aabp)/(área de Aabc) 

24 . Tome a q sobre el segmento de recta de b a c y considere 
la recta que pasa por q y a, que se puede representar como 
p = (1 — x)q + xa para toda x real. Pruebe que, para cada x, 
det [ p b c ] = x • det [ á b c ]. A partir de esto y de un 
trabajo anterior, concluya que el parámetro x es la primera 
coordenada baricéntrica de p. Sin embargo, por construcción, 
el parámetro x también determina la distancia relativa entre 
p y q sobre el segmento de q a a. (Cuando x = 1 , p = a). 
Cuando este resultado se aplica al ejemplo 5 , demuestra que 
los colores en el vértice a y el punto q se interpolan suavemente 
conforme p se mueve a lo largo de la recta entre a y q. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Del ejemplo 1, el problema es determinar si los puntos son afínmente dependientes. 
Utilice el método del ejemplo 2 y reste un punto de los otros dos. Si uno de esos dos nue¬ 
vos puntos es múltiplo del otro, entonces los tres puntos originales se encuentran sobre 
una recta. 
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2. En esencia, la demostración del teorema 5 señala que una relación de dependencia afín 
entre puntos corresponde a una relación de dependencia lineal entre las formas homo¬ 
géneas de los puntos, utilizando los mismos pesos. Así, por reducción de filas: 



"4 

1 

5 

r 


" 1 

1 

1 

1 " 

<1 

K> 

II 
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0 

4 
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1 

5 
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1 

1 

1 

1 
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0 

4 

2 


" 1 

0 

0 

— 

O 





~ 

0 

1 

0 

1.25 






0 

0 

1 

.75 






Vea esta matriz como la matriz de coeficientes de Ax = 0 con cuatro variables. Enton¬ 
ces X4 es libre, x\ = X4, x 2 = —1.25x4, y x 3 = —. 15 xa. Una solución es x¡ = X4 = 4, 
X 2 = —5 y X 3 = —3. Una dependencia lineal entre las formas homogéneas es 
4vi — 5 v 2 — 3 v 3 + 4 v 4 = 0 . De esta forma, 4vi — 5v 2 — 3v 3 + 4v4 = 0 . 

Otro método de solución es trasladar el problema al origen restando vi de los otros 
puntos, encontrar una relación de dependencia lineal entre los puntos trasladados, y 
después reacomodar los términos. La cantidad de aritmética implicada es casi la misma 
que en el enfoque que se acaba de mostrar. 


8.3 


COMBINACIONES CONVEXAS 


La sección 8.1 consideró combinaciones lineales especiales de la forma 

C 1 V 1 + c 2 v 2 -I-1- Ck\k donde c\ + c 2 4-f cj = 1 

Esta sección, además, impone la restricción de que los pesos sean no negativos. 

DEFINICION Una combinación convexa de puntos vi, v 2 ,..., v* en IR" es una combinación lineal de 
la forma 

C 1 V 1 + c 2 v 2 + ••• + C k \k 

tal que ci + c 2 + • • • + c k = I y c¡ > 0 para toda i. El conjunto de todas las combi¬ 
naciones convexas de puntos en un conjunto S es la envolvente convexa de S, y se 
denota como conv S. 


La envolvente convexa de un solo punto Vi es justamente el conjunto {vi}, igual que 
la envolvente afín. En otros casos, la envolvente convexa está adecuadamente contenida en la 
envolvente afín. Recuerde que la envolvente afín de puntos distintos vi y v 2 es la recta 

y = (1 — f)vi + fv 2 , con t en R 

Como los pesos en una combinación convexa son no negativos, los puntos en conv {v 3 , v 2 ¡ 
se pueden escribir en la forma 

y = (1 — f)vi + t\ 2 , con 0 < t < 1 

que es el segmento de recta entre V| y v 2 , y de aquí en adelante se denotará como v 1 v 2 . 

Si un conjunto S es afínmente independiente y si p e aff S, entonces p e conv S si y solo 
si las coordenadas baricéntricas de p son no negativas. El ejemplo 1 muestra una situación 
especial en la cual S es mucho más que solo afínmente independiente. 

EJEMPLO 1 Sean 


3 

0 

6 

, v 2 = 

~-6~ 

3 

3 

, v 3 = 

"3" 

6 

0 

- Pi = 

"0 

3 

3 

- P 2 = 

■-10" 

5 

11 

-3 


0 


3 


0 


-4 


vi = 
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y S = {vi, \ 2 , V3}. Observe que S es un conjunto ortogonal. Determine si pi está en Gen S, aff 
S y conv S. Y después haga lo mismo para P 2 . 

SOLUCION Sip h es al menos, una combinación lineal de los puntos en S, entonces es fácil 
calcular los pesos porque S es un conjunto ortogonal. Sea W el subespacio generado por S. 
Un cálculo como en la sección 6.3 indica que la proyección ortogonal de p¡ sobre W es el 
mismo pi: 


proyvr = 


PiU 

Vi-Vi 


Vi + 


PlV2 

V 2 -V 2 


V2 + 


PlV3 

V 3 -V 3 


V3 


18 18 18 
ttVi + — v 2 + —v 3 



3 


"-6 


"3 


"0" 

1 

0 

1 

3 

1 

6 


3 

3 

6 

+ 3 

3 

+ 3 

0 

— 

3 


-3 


L 0 


3 


0 


Esto muestra que pi está en Gen S. Además, puesto que los coeficientes suman 1, pi está 
en aff S. De hecho, pi está en conv S porque los coeficientes también son no negativos. 

Para P 2 , un cálculo similar indica que proy^ P 2 A P 2 - Como pi'oy M / P 2 es el punto en 
Gen S más cercano a P 2 , entonces el punto P 2 no está en Gen S. En particular, P 2 no puede 
estar en aff S o conv S. ■ 

Recuerde que un conjunto S es afín si contiene todas las rectas determinadas por pares 
de puntos en S. Cuando la atención se restringe a combinaciones convexas, la condición ade¬ 
cuada implica segmentos de recta en vez de rectas. 


DEFINICIÓN 


Un conjunto S es convexo si para cada p, q e S, el segmento de recta pq está con¬ 
tenido en S. 


Intuitivamente, un conjunto S es convexo si todo par de puntos en el conjunto se puede 
“ver” entre sí sin que la línea de visión salga del conjunto. La figura 1 ilustra esta idea. 


Convexo 

FIGURA 1 


Convexo 


No convexo 


El siguiente resultado es análogo al teorema 2 para conjuntos afines. 


TEOREMA 7 


Un conjunto S es convexo si y solo si cada combinación convexa de puntos de S se 
encuentra en S. Es decir, S es convexo si y solo si S = conv S. 


DEMOSTRACIÓN El argumento es similar al utilizado en la demostración del teorema 2. 
La única diferencia está en el paso de inducción. Al tomar una combinación convexa de 
k + 1 puntos, considere y = CiVi + • • • + Ck\k + Ck+i^k+i- donde + ••• + Ck+i = 1 y 
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0 < q s 1 para toda i. Si Ck+ 1 = 1, entonces y = v*+i> que pertenece a S. y no hay más 
que probar. Si Ck+\ < 1, sea t = + c*. Entonces, t = 1 — Ck +1 > 0 y 

y = (1 - c fc+ i)(yVi +-f y v¿) + c^+iV^+1 (1) 

Según la hipótesis de inducción, el punto z = (ci/f)vi + ••• + (/ t )v& está en 5 porque 
los coeficientes no negativos suman 1. Así, la ecuación (1) presenta a y como una combina¬ 
ción convexa de dos puntos en S. De acuerdo con el principio de inducción, cada combinación 
convexa de tales puntos se encuentra en S. ■ 

El teorema 9 que se expone a continuación ofrece una caracterización más geométrica 
de la envolvente convexa de un conjunto. Se requiere un resultado preliminar de intersec¬ 
ciones de conjuntos. Recuerde de la sección 4.1 (ejercicio 32) que la intersección de dos 
subespacios es, en sí misma, un subespacio. De hecho, la intersección de cualquier colección 
de subespacios es, en sí misma, un subespacio. Un resultado similar es válido para conjuntos 
afines y conjuntos convexos. 


TEOREMA 8 


Sea {S a : a e ^4} cualquier colección de conjuntos convexos. Entonces, n„ e _ 4 .S' ri; es 
convexo. Si {7/3: yS e i3} es cualquier colección de conjuntos afines, entonces 
es afín. 


DEMOSTRACION Si p y q están en D5 a , entonces p y q están en cada S a . Como cada S a 
es convexo, el segmento de recta entre p y q está en S a para toda a y, por lo tanto, ese seg¬ 
mento está contenido en fA’,,. La demostración para el caso afín es similar. ■ 


TEOREMA 9 


Para cualquier conjunto S, la envolvente convexa de S es la intersección de todos los 
conjuntos convexos que contienen a S. 


DEMOSTRACIÓN Sea T la intersección de todos los conjuntos convexos que contienen a S. 
Como conv S es un conjunto convexo que contiene a S, se deduce que T C conv S. Por otro 
lado, sea C cualquier conjunto convexo que contiene a S. Entonces, C contiene a toda com¬ 
binación convexa de puntos de C (teorema 7) y, por consiguiente, también contiene a toda 
combinación convexa de puntos del subconjunto S. Es decir, conv S C C. Puesto que esto es 
verdad para todo conjunto convexo C que contiene a S. esto también es válido para la inter¬ 
sección de todos ellos. Es decir, conv SCT. ■ 

El teorema 9 señala que conv S es, en un sentido natural, el “menor” conjunto convexo 
que contiene a S. Por ejemplo, considere un conjunto S que está dentro de algún gran rec¬ 
tángulo en IR 2 , e imagine estirar una banda de hule alrededor del exterior de S. Cuando la 
banda se contrae alrededor de S, indica la frontera de la envolvente convexa de S. O bien, 
para usar otra analogía, la envolvente convexa de S llena todos los huecos en el interior de S 
y rellena todas las abolladuras en la frontera de S. 

EJEMPLO 2 

a) A continuación se muestran las envolventes convexas de los conjuntos S y T en R 2 . 



S 


conv S 


T 


conv T 
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b ) Sea S el conjunto que consta de la base estándar para IR 3 , S = {e¡, e 2 , e 3 }. Entonces, 
conv S es una superficie triangular en R 3 , con vértices ei, e 2 y e 3 . Véase la figura 2. ■ 


EJEMPLO 3 Sea S = 
de S es la unión del origen y 


x > 0 y y = x 2 j. Demuestre que la envolvente convexa 
: x > 0 y y > x 2 \. Véase la figura 3. 


SOLUCIÓN Cada punto en conv S debe estar en un segmento de recta que conecte dos 
puntos de S. La línea discontinua de la figura 3 indica que, excepto por el origen, el eje y 
positivo no está en conv S, porque el origen es el único punto de S sobre el eje y. Parece¬ 
ría razonable que la figura 3 muestre conv S, pero, ¿cómo se podría estar seguro de que el 
punto (10 2 , 10 4 ), por ejemplo, está sobre un segmento de recta del origen a un punto sobre 
la curva en 57 

Considere cualquier punto p en la región sombreada de la figura 3, por ejemplo, 


y 

I !y = x 2 


x 


FIGURA 3 


P = 



con a > 0 y b > a 2 


La recta que pasa por 0 y p tiene la ecuación y = (b/á)t para t real. Esta recta se interseca 
con S donde t satisface (b/a)t = t 2 , es decir, cuando t = b/a. Así, p está sobre el segmento 


de recta de 0 a 


b/a 
b 2 /a 2 


, lo que indica que la figura 3 es correcta. 


El siguiente teorema es básico en el estudio de conjuntos convexos. Constantin 
Caratheodory fue el primero en probarlo en 1907. Si p está en la envolvente convexa de 
S , entonces, por definición, p debe ser una combinación convexa de puntos de S. Pero la 
definición no establece cuántos puntos de S se requieren para construir la combinación. 
El notable teorema de Caratheodory dice que en un espacio «-dimensional, el número de 
puntos de S en la combinación convexa nunca es mayor que n + 1. 


TEOREMA 10 


(Caratheodory) Si S es un subconjunto no vacío de R", entonces cada punto en conv S 
se puede expresar como una combinación convexa de n + 1 o menos puntos de S. 


DEMOSTRACION Dado p en conv S, se puede escribir p = ciVi + ••• + c/,v k , donde 
v, e 5, C[ + ••• + c k = 1 y c¡ > 0, para alguna k e i = 1,..., k. El objetivo es demostrar 
que tal expresión existe para p con k < n + 1. 

Si k > n + 1, entonces {vi,..., v /f } es afínmente dependiente, de acuerdo con el ejerci¬ 
cio 12 de la sección 8.2. Así, existen escalares di,..., ¿ 4 , no todos cero, tales que 

k k 

J2 d iVi = 0 y X> = ° 

i=i i=i 

Considere las dos ecuaciones 

ClVi + c 2 v 2 -I-h c k \ k = p 


y 


d\\\ + d 2 \2 H-1- d k \ k = 0 

Restando un múltiplo adecuado de la segunda ecuación a la primera, se elimina uno de los 
términos v, y se obtiene una combinación convexa de menos que k elementos de S que es 
igual a p. 
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Como no todos los coeficientes d¡ son cero, podemos suponer (reacomodando subín¬ 
dices, si es necesario) que ¿4 > 0 y que cijdk s c¡/d¡ para todas aquellas i para las que 
d, > 0. Para i = 1 sea b¡ = c¡ — (cijdk)d¡. Entonces, b¡- = 0 y 


2> = E 


c¡ - 


k 



,= 1 - 0=1 


Además, cada b¡ > 0. En realidad, si d¡ < 0, entonces b¡ > c¡ > 0. Si d, > 0, entonces 
b¡ = di(c¡/d¡ — Cu/dk) £ 0. Por construcción, 


k -1 


I> V ‘ 


k 


X> v < = 

i = 1 
k 


E í; ' v ' - 

í=i 



f X>v, = í>, 

i = 1 / = 1 


= p 


De esta forma, p ahora es una combinación convexa de k — 1 de los puntos vi,..., v*. 
Este proceso se puede repetir hasta que p se exprese como una combinación convexa de, 
a lo sumo, n + 1 de los puntos de S. ■ 

El siguiente ejemplo ilustra los cálculos de la demostración anterior. 


EJEMPLO 4 Sean 



"1" 


"2" 


'5' 


'3' 


10 “ 
3 

Vi = 

0 

. V 2 = 

3 

, v 3 = 

4 

, v 4 = 

0 

, P = 

5 

_ 2 _ 


y s = {Vi, v 2) v 3 , v 4 }. Luego, 

?Vl + gV2 + 5V3 + ^V 4 = P ( 2 ) 

Utilice el procedimiento de la demostración del teorema de Caratheodory para expresar p 
como una combinación convexa de tres puntos de S. 

SOLUCION El conjunto S es afínmente dependiente. Utilice las técnicas de la sección 8.2 
para obtener una relación de dependencia afín 


—5vi + 4 v 2 — 3v 3 + 4v 4 = 0 (3) 

Después, seleccione los puntos v 2 y v 4 en (3), cuyos coeficientes sean positivos. Para cada 
punto, calcule la razón de los cocientes en las ecuaciones (2) y (3). La razón para v 2 es 
g = 4 = jL, y p ara v 4 es J2 -7- 4 = ¿-La razón para v 4 es menor, así que reste multipli¬ 
cado por la ecuación (3) de la ecuación (2) para eliminar v 4 : 

(5 + Ü) V 1 + (l ~ á) V 2 + (5 + á) V 3 + (u - é) V 4 = P 

+ 2Ly 2 + |V 3 = P ■ 

Por lo general, este resultado no se puede mejorar al disminuir el número requerido de 
puntos. En realidad, dados cualesquiera tres puntos no colineales en IR 2 , el centroide del trián¬ 
gulo formado por ellos está en la envolvente convexa de los tres, pero no está en la envolvente 
convexa de dos cualesquiera de ellos. 
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PROBLEMAS DE PRÁCTICA 



" 6 " 


"7" 


~- 2 “ 


T 


"3" 

1. Sean vi = 

2 

2 

, v 2 = 

1 

5 

, v 3 = 

4 

-1 

. Pi = 

3 

1 

y p 2 = 

2 

1 


\2, V3}. Determine si pi y P 2 están en conv S. 

2. Sea S el conjunto de puntos sobre la curva y = I /x para y > 0. Explique geométricamente 
por qué conv S consiste en todos los puntos sobre la curva S y por arriba de ella. 


8.3 EJERCICIOS 


1. En 


sea S = 


: 0 < y < lj U j 


Describa 


(o bosqueje) la envolvente convexa de S. 

2. Describa la envolvente convexa del conjunto S de puntos 

en IR 2 que satisfacen las condiciones indicadas. Justifique sus 
respuestas. (Demuestre que un punto arbitrario p en S pertenece 
a conv S ). 

a) y ~ 1 /x y x a 1/2 

b) y = sen x 

c ) y = ,r 1/2 yx> 0 

3. Considere los puntos del ejercicio 5 de la sección 8.1. ¿Cuáles 
de pi, P2 y p 3 están en conv 5? 

4. Considere los puntos del ejercicio 6 de la sección 8.1. ¿Cuáles 
de pi, P2 y P3 están en conv 5? 

5. Sean 



'-1 " 


" 0" 


1 " 


1 ' 

Vi = 

-3 

, v 2 = 

-3 

. v 3 = 

-1 

-v 4 = 

1 


4 _ 


1 _ 


4 


-2 


1 " 


0" 



Pi = 

-1 

, p 2 = 

-2 

, 



2 


2 




y sea S = {vi, V2, V3, V4}. Determine si pi y pj están en 
conv S. 


6 . Sean Vi = 


-y 2 ■ 


o' 

-2 

2 

1 


. v 3 : 


—2 

1 

0 

2 


Pi 


-1 ' 

2 
3 

“ 2 

5 

L 2-1 



1 “ 

2 


6 “ 


'- 1 ' 


0 


-4 


-2 

p, = 

1 

4 

• p 3 = 

1 

y p 4 = 

0 


7 

L 4 J 


-1 


4 


y S el conjunto 


ortogonal {vi, V 2 , v 3 }. Determine si cada p, está en Gen S, aff S 
o conv S. 

a) pi b) p 2 c) P 3 d) p 4 


7. a) Sea T = 


Los ejercicios 7 a 10 utilizan la terminología de la sección 8.2. 

- 1 ' 

0 



" 2 ' 


" 4 " 

’ 

_ 3 _ 

’ 

1 


y sean 


X 


"2" 


'3' 


"2" 


"0" 

_y_ 

Pi = 

1 

p 2 = 

2 

p 3 = 

0 

y p 4 = 

2 


Encuentre las coordenadas baricéntricas de pi, P2, P3 y P4 
con respecto a T. 

b) Utilice sus respuestas del inciso a) para determinar si cada 
uno de pi,..., P 4 en el inciso a) está dentro, fuera o en la 
arista de conv T, una región triangular. 


8 . Repita el ejercicio 7 para T = 


r 21 


roí 


"- 1 " 

0 

’ 

Ut 

’ 

1 


Pi = 


p 2 = 


P 3 = 


1 

3 J 


yp 4 = 


9 . 


Sea 5 = ¡Vi, v 2 , v 3 , V4} un conjunto afínmente independiente. 
Considere los puntos pi,..., ps, cuyas coordenadas baricéntri¬ 
cas con respecto a S están dadas por (2. 0. 0, — 1), (0, i) 
(|,0, |, —1), (|, |) y (1,0, |,0), respectivamente. Deter¬ 

mine si cada uno de p 1,..., P5 está dentro, fuera o sobre la super¬ 
ficie de conv S, un tetraedro. ¿Algunos de esos puntos están en 
la arista de conv S? 


10. Repita el ejercicio 9 para los puntos q 3 ,..., qs cuyas coordenadas 

baricéntricas con respecto a S están dadas por (|, 
(f.-Í.O.i), (0,|,i,0). (0,-2,0,3) y (|, |,0), respec¬ 

tivamente. 

En los ejercicios 11 y 12, marque cada enunciado como verdadero o 
falso. Justifique sus respuestas. 

11. a) Si y = C 1 V 1 + C 2 V 2 + C 3 V 3 y ci + C 2 + c 3 = 1, entonces y 

es una combinación convexa de Vi, V 2 y v 3 . 

b) Si S es un conjunto no vacío, entonces conv S contiene al¬ 
gunos puntos que no están en S. 

c) Si 5 y T son conjuntos convexos, entonces S L) T también es 
convexo. 

12. a) Un conjunto es convexo si x, y e S implica que el segmen¬ 

to de recta entre x y y está contenido en S. 

b) Si S y T son conjuntos convexos, entonces S fl T también 


es convexo. 



460 CAPÍTULO 8 Geometría de espacios vectoriales 


c) Si S es un subconjunto no vacío de IR 5 y y e conv S, en¬ 
tonces existen distintos puntos Vi,..., V 6 en S tales que y 
es una combinación convexa de Vi,..V 6 - 


13 . Sea S un subconjunto convexo de IR" y suponga que /: IR” —> IR'" 
es una transformación lineal. Demuestre que el conjunto f(S) = 
[/(x): x e 5) es un subconjunto convexo de IR'". 


14 . Sean / : IR" —» IR'" una transformación lineal y T un subcon¬ 
junto convexo de IR'". Demuestre que el conjunto S = {x e IR" : 
/(x) e T} es un subconjunto convexo de IR". 


15. 


Sean Vi = 


■ 1 " 


" 1 " 


"4" 


" 4" 

0 

, V 2 = 

2 

, v 3 = 

2 

, v 4 = 

_ 0 _ 


P = 


2 

1 


. Confirme que 


b) Encuentre un ejemplo en IR 2 para demostrar que la igualdad 
no necesariamente es válida en el inciso a). 

20. a) conv (A fl B) C [(conv A) fl (conv B)] 

b) Encuentre un ejemplo en IR 2 para probar que la igualdad no 
necesita ser válida en el inciso a). 

21. Considere que po, pi y p 2 son puntos en IR", y de¬ 
fina f 0 (í) = (1 - í)p 0 + íPi> fi(Ó = (1 - í)Pi + ?P 2 y 

g(í) = (1 — f)fo(í) + tfi(í) para 0 < t < 1. Para los pun¬ 
tos que se muestran en la siguiente figura, realice un esquema 
que muestre f 0 (i), fi (¿)yg(|)- 


Pi 


P 2 


P = |vi + |v 2 + |v 3 + |v 4 y V! - v 2 + v 3 - v 4 = 0 


Utilice el procedimiento de la demostración del teorema de Ca- 
ratheodory para expresar p como una combinación convexa de 
tres de las v¿. Haga esto de dos formas. 

16 . Repita el ejercicio 9 para los puntos Vi = 




' 3 ' 


f 


' r 

v 3 = 

1 

, v 4 = 

-1 

yp = 

2 


, considerando que 


P = líí V l + lt V 2 + 3 + n V 4 

y 

10vi — 6 v 2 + 7v 3 — 11 v 4 = 0 


En los ejercicios 17 a 20, demuestre el enunciado en cuestión res¬ 
pecto de los subconjuntos A y 6 de IR”. Una demostración para un 
ejercicio puede emplear resultados de ejercicios anteriores. 

17 . Si A C B y B es convexo, entonces conv Ací. 

18 . Si A C B, entonces conv A C conv B. 

19 . á) [(conv A) U (conv B)] C conv (A U B) 


22. Repita el ejercicio 21 para f 0 (f), fj (f) y g (§). 

23. Sea g(t) como se define en el ejercicio 21. Su gráfica se llama 
cun’a cuadrática de Bézier, y se utiliza en algunos diseños de 
gráficos computacionales. Los puntos po, pi y p 2 se llaman pun¬ 
tos de control de la curva. Calcule una fórmula para g (t) que 
implique solamente a po, pi y p 2 - Después, demuestre que g(?) 
está en conv [po, pi, p 2 J para 0 £ t £ 1. 

24. Dados los puntos de control po, Pi, p 2 y p 3 en IR”, sea gfif) para 
0 £ t £ 1 la curva cuadrática de Bézier del ejercicio 23 determi¬ 
nada por po, pi y p 2 , y sea g 2 (f) definida de manera similar para 
Pi, P 2 y P 3 - Para 0 < t < 1, defina h(í) = (1 - í)gi(í) + ?g 2 (0- 
Demuestre que la gráfica de h(t) está en la envolvente convexa 
de los cuatro puntos de control. A esta curva se le llama curva 
cúbica de Bézier , y su definición aquí es un paso en un algo¬ 
ritmo para construir curvas de Bézier (analizadas en la sección 
8.6). Una curva de Bézier de grado k se determina por k + 1 
puntos de control, y su gráfica está en la envolvente convexa de 
esos puntos de control. 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. Los puntos vi, v 2 y V 3 no son ortogonales, así que se calcula 


< 

to 

1 

< 

II 

1 " 
-1 

< 

U) 

1 

< 

II 

"-8 

2 

. Pi - vi = 

"-5 

1 

y p 2 - Vi = 

1 

en 0 

1 

1 _ 


3 


-3 


-1 


L-1 1 


Aumente la matriz [v 2 — Vi V 3 — vi] con Pi — Vi y p 2 — v¡ y reduzca por filas: 


1 -8 -5 -3" 


1 

O 

1 _ 

-12 10 


0 1 ? 1 

3 2 

3 -3 -1 -1 


0 0 0 -§ 


La tercera columna indica que Pi — v¡ = |(v 2 — vi) + |(v 3 — Vi), lo que conduce a 
P! = Ovi -I- |v 2 + |v 3 . Así, pi está en conv S. De hecho, pi está en conv {v 2 , V3}. 
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8.4 HIPERPLANOS 


DEFINICIÓN 


La última columna de la matriz indica que P 2 — Vi no es una combinación lineal 
de \2 — Vi y V 3 — Vi. Así, p 2 no es una combinación afín de vi, \2 y V 3 , por lo que P 2 
quizá no esté en conv S. 

Un método de solución alternativo consiste en reducir por filas la matriz aumentada 
de las formas homogéneas: 

0 0 0 0 " 

1 0 i 0 

o 1 I 0 

0 0 0 1 _ 

2. Si p es un punto arriba de S, entonces la recta que pasa por p con pendiente — 1 se inter¬ 
secará con S en dos puntos antes de llegar a los ejes xy y positivos. 


[vj V 2 V 3 P! p 2 ] 


Los hiperplanos desempeñan un papel especial en la geometría de IR" porque dividen el es¬ 
pacio en dos porciones, justo como un plano separa a R 3 en dos partes y una recta corta a R 2 . 
La clave al trabajar con hiperplanos es utilizar simples descripciones implícitas, en vez de las 
representaciones explícitas o paramétricas de rectas y planos empleadas en el estudio anterior 
de conjuntos afines . 1 

Una ecuación implícita de una recta en R 2 tiene la forma ax + by = d. Una ecuación 
implícita de un plano en R 3 tiene la forma ax + by + cz = d. Ambas ecuaciones describen 
la recta o el plano como el conjunto de todos los puntos en los cuales una expresión lineal 
(también llamada funcional lineal) tiene un valor fijo, d. 


Una funcional lineal en R" es una transformación lineal / de R" en R. Para todo es¬ 
calar d en R, el símbolo [/: d] denota el conjunto de todas las x en R" para las cuales 
el valor de / es el. Es decir, 

[/: d] es el conjunto {x e R" :/(x) = d] 

La funcional cero es la transformación tal que /(x) = 0 para toda x en R". Todas las 
demás funcionales lineales en R" son diferentes de cero. 


EJEMPLO 1 En R 2 , la recta x — 4y = 13 es un hiperplano en R 2 , y es el conjunto de 
puntos en los que la funcional lineal f(x, y) = x — 4y tiene valor 13. Es decir, la recta es el 
conjunto [/: 13]. ■ 

EJEMPLO 2 En R 3 , el plano 5x — 2y + 3z = 21 es un hiperplano, el conjunto de puntos 

en los que la funcional lineal g(x, y, z) = 5x — 2 y + 3z tiene valor 21. Este hiperplano es el 

conjunto [g : 21]. ■ 

Si / es una funcional lineal en R", entonces la matriz estándar de esta transformación 
lineal / es una matriz A de 1 x n, por ejemplo, A = [a\ «2 • ■ • a,,]. De manera que 

[/: 0] es igual que {x e R" : Ax = 0} = Nul A (1) 


1 Las representaciones paramétricas se estudiaron en la sección 1.5. 
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Si /es una funcional distinta de cero, entonces rango de A = 1, y dim Nul A = n — 1, de 
acuerdo con el teorema del rango . 2 Así, el subespacio [/: 0] tiene dimensión n — 1 y, por 
lo tanto, es un hiperplano. Además, si d es cualquier número en IR, entonces 

[/: d] es igual que ¡xeR": Ax = d} (2) 

Recuerde del teorema 6 de la sección 1.5 que el conjunto de soluciones de Ax = b se 
obtiene al trasladar el conjunto solución de Ax = 0, empleando cualquier solución particular 
p de Ax = b. Cuando A es la matriz estándar de la transformación/, este teorema dice que 

[/: d] = [/: 0] + p para cualquier p en [/: d] (3) 

Por lo tanto, los conjuntos [/: d] son hiperplanos paralelos a [/: 0]. Véase la figura 1. 



FIGURA 1 Hiperplanos paralelos, 
con /(p) = d. 


Cuando A es una matriz de 1 x n, la ecuación Ax = d se puede escribir con un producto 
interno n-x, empleando n en IR" con las mismas entradas que A. Así, a partir de (2), 

[/: d] es igual que ¡x e IR" : n-x = d} (4) 

Entonces, [/: 0] = ¡x e IR": n-x = 0}, lo que muestra que [/: 0] es el complemento ortogonal 
del subespacio generado por n. En la terminología de cálculo y geometría en IR 3 , n se llama 
un vector normal a [/: 0]. (Un vector “normal” en este sentido no necesita tener longitud 
unitaria). Además, se dice que n es normal a cada hiperplano paralelo [/: d], aunque n-x no 
es cero cuando d A 0. 

Otro nombre para [/: d] es conjunto nivel de /, y n algunas veces se llama gradiente 
de / cuando /(x) = n-x para cada x. 


EJEMPLO 3 


Sean n = 




, y sea H 


¡x : n-x = 12 }, de manera que 


H = [/: 12], donde f(x, y) = 3x + 4y. Por lo tanto, H es la recta 3x + 4y = 12. Encuentre 
una descripción implícita del hiperplano paralelo (recta) H\ = H + v. 


SOLUCIÓN Primero, encuentre un punto p en H\. Para hacer esto, determine un punto en H 


y súmele v. Por ejemplo, 


0' 


r 


'0' 


r 

3 

está en H, así que p = 

-6 

+ 

3 

— 

-3 


está en H\. 


Ahora, calcule n-p = —9. Esto indica que H\ = [/: —9]. Véase la figura 2, que también 
muestra el subespacio Hq = ¡x : n-x = 0). ■ 


Los siguientes tres ejemplos revelan conexiones entre descripciones implícitas y explíci¬ 
tas de hiperplanos. El ejemplo 4 inicia con una forma implícita. 


2 Véase el teorema 14 de la sección 2.9 o el teorema 14 de la sección 4.6. 
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FIGURA 2 


EJEMPLO 4 En R 2 , dé una descripción explícita de la recta x — 4y = 13 en forma vec¬ 
torial paramétrica. 

SOLUCION Esto equivale a resolver una ecuación no homogénea Ax = b, donde A = 
[1 -4] y b es el número 13 en IR. Escriba x = 13 + 4y, donde y es una variable libre. 
En forma paramétrica, la solución es 


_ x _ 

.y. 


13 + 4y 

y 


r4' _ 

i 


P + vq, y G 


Es más complicado convertir una descripción explícita de una recta a la forma implícita. 
La idea básica es construir [/: 0] y después encontrar d para [/: d\. 


EJEMPLOS Sean vi 


y L\ la recta que pasa por vi y \ 2 - Encuentre 


una funcional lineal/y una constante d tales que L\ = [/: d], 

SOLUCION La recta L\ es paralela a la recta trasladada Lq a través de V 2 — Vi y el origen. 
La ecuación que define a Lq tiene la forma 

\a b ] A =0 o n-x = 0 donde n= (5) 

y b 

Como n es ortogonal al subespacio Lq, que contiene a v 3 — Vi, calcule 


’6l r 1 1 r - 
Vl “|_°J [ 2 J — [ —2 


y resuelva 


Por inspección, una solución es [ a b ] = [2 5], Sea f(x, y) = 2x + 5y. A partir de (5), 
Lq = [/: 0], y L\ = [/: d] para alguna d. Como V| está sobre la recta L\, d = /(vi) = 2(1) + 
5(2) = 12. Así, la ecuación para L\ es 2x + 5y = 12. Como comprobación, observe que 
f(yi) = /(6, 0) = 2(6) + 5(0) = 12, de manera que V 2 también está sobre L\. ■ 


EJEMPLO 6 Sean vi 


1 

1 , v 2 


2 

-1 y v 3 


1 . Encuentre una descripción 

2 


implícita [/: íí] del plano H\ que pasa por vi, V 2 y v 3 . 
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SOLUCIÓN H\ es paralelo a un plano Hq que pasa por el origen y que contiene los puntos 
trasladados 



r H 


"2" 

II 

> 

1 

<N 

> 

1 

<N m 

1 

_1 

y v 3 - V! = 

0 

1 


Como esos dos puntos son linealmente independientes, Hq = Gen{v 2 — Vi, V 3 — vi}. 

Tal 


Sea n = 


b 


la normal a Hq. Entonces, V 2 — Vi y V 3 — vi son ortogonales a n. Es decir. 


L c J 

(v 2 — vi)-n = 0 y (V 3 — Vi)-n = 0. Esas dos ecuaciones forman un sistema cuya matriz 
aumentada se puede reducir por fdas: 



a 


a 

r 

[1 -2 3] 

b 

= 0 , [2 0 1 ] 

b 

= 0 , 


c 


c 

- 


1 -2 

2 0 


Las operaciones de fila dan a = (— |)c, b = (f)c, con c libre. Establezca c = 4, por ejemplo. 


Entonces, n = 


-2 

5 

4 


y Hq = [/: 0], donde/(x) = — 2x¡ + 5 x 2 + 4 x 3 . 


El hiperplano paralelo H¡ es [/: d]. Para encontrar d. considere el hecho de que vi está 
en H\, y calcule d = f{\\) = /(1,1, 1) = —2(1) + 5(1) + 4(1) = 7. Como comprobación, 
calcule /(v 2 ) = /(2,-l,4) = -2(2) + 5(—1) + 4(4) = 16- 9 = 7. ■ 


El procedimiento del ejemplo 6 se generaliza a mayores dimensiones. Sin embargo, para 
el caso especial de IR 3 , también se puede utilizar la fórmula del producto cruz para deter¬ 
minar n, aplicando un determinante simbólico como una regla mnemotécnica: 


n = (v 2 -vi) x (v 3 -vi) 


1 

-2 

3 



= —2i + 5j + 4k = 


-2 

5 

4 


0 

1 


1 

3 



2 

0 


k 


Si solo se necesita la fórmula para /, el cálculo del producto cruz se puede escribir como 
un determinante ordinario 



1 

2 

X| 


f(x l,x 2 ,x 3 ) = 

-2 

0 

*2 

= 


3 

1 

*3 



= — 2xi + 5x2 + 4x3 



1 

3 


X 2 + 


1 

-2 


2 

0 


x 3 


Hasta el momento, cada hiperplano examinado se ha descrito como [f '. d] para alguna 
funcional lineal / y alguna d en R, o bien, de manera equivalente como {x e R" : n-x = d] 
para alguna n en R". El siguiente teorema indica que todo hiperplano tiene estas descripcio¬ 
nes equivalentes. 


Un subconjunto H de R" es un hiperplano si y solo si H = [/: d] para alguna funcional 
lineal / diferente de cero y algún escalar d en R. De esta forma, si H es un hiperplano, 
existe un vector n diferente de cero y un número real d tales que H = {x : n-x = d\. 


TEOREMA 11 



8.4 Hiperplanos 465 


DEMOSTRACIÓN Suponga que H es un hiperplano, tome p e H, y sea Hq = H — p. Enton¬ 
ces, Hq está en un subespacio de dimensión (n — 1). Después, tome cualquier punto y que no 
esté en Hq. De acuerdo con el teorema de descomposición ortogonal de la sección 6.3, 

y = yi + n 

donde es un vector en Hq y n es ortogonal a todo vector en Hq. La función / definida por 

/(x) = n x para x e IR” 

es una funcional lineal, por las propiedades del producto interno. Ahora, [/: 0] es un hiper¬ 
plano que contiene a Hq, por construcción de n. Se deduce que 

Hq = [/: 0] 

[Argumento: Hq contiene una base S de n — 1 vectores, y como S está en el subespacio 
(n — l)-dimensional [/: 0], entonces S también debe ser una base para [/: 0], de acuerdo con 
el teorema de la base]. Finalmente, sea d = /(p) = n-p. Por lo tanto, como se muestra en 
la ecuación (3) anterior, 

[/: d] = [/: 0] + p = Hq + p = H 

El enunciado inverso de que [/: d ] es un hiperplano se deduce de las ecuaciones (1) y (3) 
anteriores. ■ 

Muchas importantes aplicaciones de hiperplanos dependen de la posibilidad de “separar” 
dos conjuntos mediante un hiperplano. Intuitivamente, esto significa que uno de los conjuntos 
está sobre un lado del hiperplano, y el otro conjunto está sobre el lado contrario. La termino¬ 
logía y la notación que se presentan a continuación ayudarán a hacer más precisa esta idea. 


y 



FIGURA 3 

El conjunto S es cerrado y 
acotado. 


TOPOLOGÍA EN IR": TÉRMINOS Y HECHOS 

Para cualquier punto p en R" y cualquier real 8 > 0, la bola abierta B{ p, 8) con centro 
en p y radio 8 está dada por 

Z?(p, 8) = [x : ||x - p|| < 5} 

Dado un conjunto S en R", un punto p es un punto interior de S si existe un 8 > 0 tal 
que B(p, 8) C S. Si toda bola abierta centrada en p se interseca con S y con el comple¬ 
mento de S, entonces p se llama punto frontera de S. Un conjunto es abierto si no 
contiene a ninguno de sus puntos frontera. (Esto es equivalente a decir que todos sus 
puntos son puntos interiores). Un conjunto es cerrado si contiene todos sus puntos 
frontera. (Si S contiene solamente algunos de sus puntos frontera, entonces S no es 
abierto ni cerrado). Un conjunto S es acotado si existe una 8 > 0 tal que S C BU), 8). 
Un conjunto en R" es compacto si es cerrado y acotado. 

Teorema: La envolvente convexa de un conjunto abierto es abierta, y la envolvente 
convexa de un conjunto compacto es compacta. (La envolvente convexa de un conjunto 
cerrado no necesita ser cerrada. Véase el ejercicio 27). 


EJEMPLO 7 Sean 




'-1' 

1 1 

"2' 

Pl = 

0 

II 

1 


como se muestra en la figura 3. Entonces, p! es un punto interior porque B (p. |) C S. 
El punto P 2 es un punto frontera porque cada bola abierta centrada en P 2 se interseca con 
S y el complemento de S. El conjunto S es cerrado porque contiene todos sus puntos frontera. 
El conjunto S es acotado porque S C /LO, 3). Por lo tanto, S también es compacto. ■ 
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DEFINICIÓN 


TEOREMA 12 


TEOREMA 13 


Notación: Si / es una funcional lineal, entonces f(A ) < d significa que /(x) < d para cada 
x g A. Las notaciones correspondientes se emplearán cuando las desigualdades estén inver¬ 
tidas o cuando sean estrictas. 


El hiperplano H = [ f:d ] separa a dos conjuntos A y B si es válida una de las siguientes 
situaciones: 

i. f(A)<dyf(B)>d,o 

ii. f(A)>dyf(B)<d. 

Si en las condiciones anteriores todas las desigualdades débiles se remplazan por desi¬ 
gualdades estrictas, entonces se dice que H separa estrictamente Ay B. 


Observe que la separación estricta requiere que los dos conjuntos sean disjuntos, lo que 
no ocurre en la separación simple. Es claro que si dos círculos en el plano son tangentes ex¬ 
ternamente, entonces su recta tangente común los separa (pero no estrictamente). 

Aunque es necesario que los dos conjuntos sean disjuntos para separarlos estrictamente, 
esta condición no es suficiente, ni siquiera para conjuntos convexos cerrados. Por ejemplo, 
sean 


A = 


1 1 

■■x>-y-<y<2 
2 x 


B = 


: x > 0 y y = 0 


Entonces, A y B son conjuntos convexos cerrados disjuntos, pero no se pueden separar es¬ 
trictamente mediante un hiperplano (recta en IR 2 ). Véase la figura 4. Así, el problema de 
separar (o de separar estrictamente) dos conjuntos con un hiperplano es más complicado 
de lo que parece. 



FIGURA 4 Conjuntos convexos cerrados 
disjuntos. 


Hay muchas condiciones interesantes sobre los conjuntos Ay B que implican la existen¬ 
cia de un hiperplano de separación, pero los siguientes dos teoremas son suficientes para esta 
sección. La demostración del primer teorema requiere de un poco de material preliminar, 3 
pero el segundo es consecuencia inmediata del primero. 


Suponga que A y B son conjuntos convexos no vacíos tales que A es compacto y B 
es cerrado. Entonces, existe un hiperplano H que separa estrictamente A y B si y solo 
siA D B = 0. 

Suponga que Ay B son conjuntos compactos no vacíos. Entonces, existe un hiperplano 
que separa estrictamente A y B si y solo si (conv A) D (conv B) = 0. 


3 Una demostración del teorema 12 se presenta en Steven R. Lay, Convex Sets and Their Applications (Nueva York: 
John Wiley & Sons, 1982; Mineóla, NY: Dover Publications, 2007), pp. 34-39. 
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DEMOSTRACIÓN Suponga que (conv A) n (conv B ) = 0. Como la envolvente convexa de 
un conjunto compacto es compacta, entonces el teorema 12 asegura que existe un hiperplano 
H que separa estrictamente conv A y conv B. Es claro que H también separa estrictamente 
a los conjuntos más pequeños Ay B. 

A la inversa, suponga que el hiperplano H = [f:d] separa estrictamente A y B. Sin pér¬ 
dida de generalidad, suponga que/(A) < d y f(B) > d. Sea x = c i x i + ••• + c k x k cualquier 
combinación convexa de elementos de A. Entonces, 


/(x) = c\ f (xi) H-h c k f(x k ) < Cid -b c k d = d 


ya que c\ + ••• + c k = 1. Por lo tanto, /(conv A) < d. Asimismo, /(conv B) > d, por lo que 
H = [f: d] separa estrictamente conv A y conv B. De acuerdo con el teorema 12, conv A 
y conv B deben ser disjuntos. ■ 

EJEMPLO 8 Sean 


ai = 

” 2 " 

1 

, a 2 = 

"-3" 

2 

, a 3 = 

"3 

4 

, bi = 

T 

0 

y b 2 = 

2 " 

-1 


1 


1 


0 


2 


5 


y sean A = {ai, a 2 , ai| y B = {bi, b 2 }■ Demuestre que el hiperplano H = [/: 5], donde 
/(x i, x 2 , X3) = 2 xi — 3x2 + X3, no separa Ay B. ¿Existe un hiperplano paralelo a H que se¬ 
pare A y B1 ¿Se intersecan las envolventes convexas de A y B1 

SOLUCIÓN Evalúe la funcional lineal /en cada uno de los puntos en A y B: 

/(a,) = 2, /(a 2 ) = —11, / (a 3 ) = —6, /(bj) = 4 y /(b 2 ) = 12 

Como /(bi) = 4 es menor que 5 y /(b 2 ) = 12 es mayor que 5, los puntos de B están en ambos 
lados de H = [f: 5] y así H no separa Ay B. 

Puesto que /(A) < 3 y f(B) > 3, el hiperplano paralelo [/: 3] separa estrictamente A 
y B. Según el teorema 13, (conv A) D (conv B) = 0. 

Precaución: Si no hay hiperplanos paralelos a H que separen estrictamente A y B, esto 
no implicaría necesariamente la intersección de sus envolventes convexas. Tal vez algún otro 
hiperplano no paralelo a H los separara estrictamente. ■ 


PROBLEMA DE PRÁCTICA 


" 1 ” 
0 

,P 2 = 

~-l“ 

2 

, ni = 

r 

1 

, n 2 = 

~- 2 " 

1 

, y considere que H\ es el hi- 

2 


1 


-2 


3 



perplano (plano) en IR 3 que pasa por el punto y que tiene vector normal ni, y // es el 
hiperplano que pasa por el punto P 2 con vector normal n 2 . Dé una descripción explícita de 
H\ D H 2 mediante una fórmula que muestre cómo generar todos los puntos en H\ D //. 


8.4 EJERCICIOS 


1. Sea L la recta en IR 2 que pasa por los puntos 



2 . 


Sea L la recta en IR 2 que pasa por los puntos 


1 

4 


y 


-2 

-1 


Encuentre una funcional lineal / y un número real d tales que 
L=[f:d). 


Obtenga una funcional lineal / y un número real d tales que 
L = [f:d]. 
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En los ejercicios 3 y 4, determine si cada conjunto es abierto o cerra¬ 
do, o bien, ni abierto ni cerrado. 


3. a) 

U*,y) 

O 

A 

b) 

{(*,y) 

,r = 2yl<y<3) 

c) 

{(*,30 

,r = 2yl<y<3) 

d) 

U*,y) 

xy = 1 y x > 0} 

e) 

(fe y) 

O 

A 

X 

Al 

X 

4. a) 

{(*,y) 

X 

to 

+ 

Ni 

II 

b) 

{(X, y) 

x 2 + y 2 > 1} 

c) 

{(x,y) 

x 2 + y 2 < 1 y y > 0] 

d) 

(fcv) 

y > x 2 } 

e) 

{(*,30 

y < x 2 } 


mal n que separa Ay B. ¿Existe un hiperplano paralelo a H que 
separe estrictamente A y S? 


13. Sean P[ 


2“ 


1 " 


' 1 ' 

-3 


2 


2 

1 

. P 2 = 

-1 

, ifi = 

4 

2 


3 


2 


n 2 


2 

3 

1 

5 


, sean H\ el hiperplano en IR 4 que pasa por pi con 


normal ni, y FF_ el hiperplano que pasa por p 2 con normal n 2 . 
Dé una descripción explícita de H\ fl FF_. [Sugerencia: Obtenga 
un punto p en H\ fl Hi y dos vectores linealmente indepen¬ 
dientes vi y v 2 que generen un subespacio paralelo al plano afín 
bidimensional H\ fl HF\. 


En los ejercicios 5 y 6, determine si cada conjunto es compacto o no, 14. Sean F¡ y F 2 planos tetradimensionales en IR 6 y suponga que F¡ 
y si es convexo o no. fl F 2 # 0. ¿Cuáles son las posibles dimensiones de F¡ fl F 2 ? 


5. Utilice los conjuntos del ejercicio 3. 

6 . Utilice los conjuntos del ejercicio 4. 


En los ejercicios 15 a 20, escriba una fórmula para una funcional 
lineal / y especifique un número d, tal que [/: d ] sea el hiperplano 
descrito en el ejercicio. 


En los ejercicios 7 a 10, sea H el hiperplano que pasa por los pun¬ 
tos mencionados, a) Encuentre un vector n que sea normal al hiper¬ 
plano. b) Obtenga una funcional lineal / y un número real d tales que 
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11. Sean p = 


1 ' 


2" 


'0' 


'-2~ 

-3 


1 


1 


0 

1 

, n = 

5 

, V! = 

1 

, v 2 = 

1 

2 


-1 


1 


3 


y v 3 = 


, y H el hiperplano en R 4 con normal n y que 


pasa por p. ¿Cuáles de los puntos vi, v 2 y v 3 están sobre un 
mismo lado de H como el origen, y cuáles no? 




2“ 
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'-1 ' 


0" 

12. Sean 

ai = 

-1 

. a 2 = 

1 

, a 3 = 

6 

. bi = 

5 



5 



3 


0 


-1 


r n 



r 2 i 


[ 

' 31 




b 2 = 


-3 

-2 


b, = 


y n = 


y sean A = {ai, 


a 2 , a 3 } y B = {bi, b 2 , b 3 ¡. Encuentre un hiperplano Fl con nor- 


15. Sea A la matriz [1 —3 4 —2] de 1 x 4, y sea b — 5. Además, 
H = {x en R 4 : Ax = b). 

16. Sea A la matriz de [2 5 —3 0 6] de 1 x 5. Observe que Nul A 
está en R 5 . Sea H = Nul A. 

17. Sea H el plano en R 3 generado por las filas de B = 

1 3 5' 


0 


. Es decir, H = Fil B. [Sugerencia: Indague 


cuál es la relación entre H y Nul B. Véase la sección 6.1], 

18. Sea H el plano en R 3 generado por las filas de B = 
1 4-5' 


0 


. Es decir, H = Fil B. 


19. Sea H el espacio columna de la matriz B = 


1 0 

4 2 

-7 -6 


Es decir, H = Col B. [Sugerencia: Indague cuál es relación entre 
Col B y Nul B t . Véase la sección 6.1]. 


20. Sea H el espacio columna de la matriz B = 
Es decir, H = Col B. 


1 0 

5 2 

-4 -4 


En los ejercicios 21 y 22, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. 

21. a) Una transformación lineal de R a R" se llama una funcio¬ 
nal lineal. 

b) Si / es una funcional lineal definida en R", entonces existe 
un número real k tal que /(x) = kx para toda x en R". 

c) Si un hiperplano separa estrictamente a los conjuntos Ay B, 
entonces A fl B = 0. 

d) Si A y B son conjuntos convexos cerrados y A fl B = 0, 
entonces existe un hiperplano que separa estrictamente 
Ay B. 




8.5 Polítopos 469 


22. a) Si d es un número real y / es una funcional lineal diferen¬ 
te de cero definida en IR", entonces [/: c/] es un hiperplano 
en IR". 

b ) Dado cualquier vector n y cualquier número real d , el con¬ 
junto ¡x : nx = d] es un hiperplano. 

c) Si A y 5 son conjuntos disjuntos no vacíos tales que A es 
compacto y 5 es cerrado, entonces existe un hiperplano que 
separa estrictamente Ay B. 

d) Si existe un hiperplano H tal que H no separa estrictamente 
a dos conjuntos Ay B, entonces (conv A) fl (conv 5) =£ 0. 


25. Sea p = 


. Encuentre un hiperplano [/: tf] que separe es¬ 


trictamente 6(0, 3) y 6(p, 1). [Sugerencia: Después de encon¬ 
trar/, demuestre que el punto v = (1 — .75)0 + ,75p no está 
en 6(0, 3) ni en 6(p, 1)]. 


26. 


Sean q = 



. Encuentre un hiperplano [f : d] 


que separe estrictamente 6(q, 3) y 6(p. 1). 


27. Dé un ejemplo de un subconjunto cerrado S de IR 2 tal que 
conv S no sea cerrado. 



' r 


' 3 ' 


' 5 ' 


" 4 " 

Vi = 

1 

, V 2 = 

0 

, v 3 = 

_ 3 _ 

y p = 

1 


. Encuen¬ 


tre un hiperplano [/ : d ] (en este caso, una recta) que separe 
estrictamente p de conv {vi, V 2 , V 3 }. 


24. Repita el ejercicio 23 para Vi 


y p = 


2 

3 



28. Dé un ejemplo de un conjunto compacto A y un conjunto ce¬ 
rrado 6 en IR 2 tales que (conv A) fl (conv 5) = 0, pero con¬ 
siderando que A y 6 no se puedan separar estrictamente con 
un hiperplano. 

29. Pruebe que la bola abierta 5(p, S) = {x : ||x — p|| < S} es un 
conjunto convexo. [Sugerencia: Utilice la desigualdad del 
triángulo], 

30. Demuestre que la envolvente convexa de un conjunto acotado 
también está acotada. 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 

Primero, calcule ivpi = —3 y n 2 p 2 = 7. El hiperplano H\ es el conjunto solución de 
la ecuación x\ + x 2 — 2*3 = —3, y II 2 es el conjunto solución de la ecuación — 2x\ + X 2 + 
3 x 3 = 7. Entonces, 


H\ fl Ho = {x : x\ + X 2 — 2 x 3 = — 3 y — 2x\ + X 2 + 3 x 3 = 7} 


Esta es una descripción implícita de H\ D H 2 . Para encontrar una descripción explícita, 
resuelva el sistema de ecuaciones por reducción de filas: 


1 -2 -3 
1 3 7 
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5 _ 10 

3 3 

1 1 

3 3 . 



10 
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3 


3 

Por lo tanto, Xi = —y + |x 3 ,X 2 = \ + ^X 3 ,X 3 = x 3 . Sean p = 

1 

3 

II 

> 

1 

3 


0 


1 


La solución general se puede escribir como x = p + X 3 V. Así, H\ D Hi es la recta que pasa 
por p en la dirección de v. Observe que v es ortogonal tanto a ni como a n 2 . 


8.5 POLÍTOPOS 


Esta sección estudia propiedades geométricas de una importante clase de conjuntos convexos 
compactos llamados polítopos. Esos conjuntos se presentan en todo género de aplicaciones, 
incluyendo teoría de juegos, programación lineal y problemas de optimización más genera¬ 
les, como el diseño de controles de retroalimentación para sistemas de ingeniería. 
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CAPITULO 8 


Geometría de espacios vectoriales 


DEFINICIÓN 


DEFINICIÓN 


Un polítopo en R" es la envolvente convexa de un conjunto finito de puntos. En R 2 , 
un polítopo es simplemente un polígono. En R 3 , un polítopo se llama poliedro. Caracterís¬ 
ticas importantes de un poliedro son sus caras, aristas y vértices. Por ejemplo, el cubo tiene 
6 caras cuadradas, 12 aristas y 8 vértices. Las siguientes definiciones aportan terminología 
para mayores dimensiones, así como para R 2 y R 3 . Recuerde que la dimensión de un con¬ 
junto en R" es la dimensión del plano afín más pequeño que lo contiene. Además, observe 
que un polítopo es un tipo especial de conjunto convexo compacto, porque un conjunto fi¬ 
nito en R" es compacto y la envolvente convexa de este conjunto también es compacta, de 
acuerdo con el teorema incluido en el recuadro de términos y hechos en topología, de la 
sección 8.4. 


Sea S un subconjunto convexo compacto de R". Un subconjunto F no vacío de S es 
una cara (propia) de S si F A S y existe un hiperplano H = [ f: el] tal que F = S fl H 
y f(S) < d o f(S) > d. El hiperplano H es un hiperplano de soporte para S. Si la di¬ 
mensión de F es k, entonces F es una A:-cara de S. 

Si P es un polítopo de dimensión k, entonces P se llama un /r-polítopo. Una 0-cara 
de P se llama vértice, una 1 -cara es una arista, y una (k — 1 I-dimensional cara es una 
faceta de S. 


EJEMPLO 1 Suponga que S es un cubo en R 3 . Cuando un plano H se traslada en R 3 
hasta que apenas toca (soporta) al cubo, pero no corta el interior de este, entonces hay tres 
posibilidades para H fl S, dependiendo de la orientación de H. (Véase la figura 1). 

H fl S puede ser una cara cuadrada bidimensional (faceta) del cubo. 

H fl S puede ser una arista unidimensional del cubo. 

H fl S puede ser un vértice de dimensión 0 del cubo. ■ 



H n S es bidimensional. 



FIGURA 1 



H n S es de dimensión 0. 


La mayoría de las aplicaciones de polítopos de alguna manera implican a los vértices, 
porque estos tienen una propiedad especial que se identifica en la siguiente definición. 


Sea S un conjunto convexo. Un punto p en S es un punto extremo de S si p no está 
en el interior de algún segmento de recta contenido en S. Más precisamente, si x, 
y g S y p g xy, entonces p = x o p = y. El conjunto de todos los puntos extremos 
de S se llama perfil de S. 
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H 


P 


FIGURA 2 


Un vértice de cualquier conjunto convexo S compacto es automáticamente un punto ex¬ 
tremo de S. Este hecho queda asentado en la demostración del teorema 14, que se presenta 
a continuación. Al trabajar con un polítopo, por ejemplo, P = conv {vi,..., v/.¡ para Vi,..., v¿ 
en R", por lo general es útil saber que Vi,..., v¿ son los puntos extremos de P. Sin embar¬ 
go, esta lista podría contener puntos extraños. Es decir, por ejemplo, algún vector v, podría 
ser el punto medio de una arista del polítopo. Desde luego, en este caso v, realmente no se 
necesita para generar la envolvente convexa. La siguiente definición describe la propiedad 
de los vértices que hace que sean puntos extremos. 


DEFINICIÓN 


El conjunto {vi,..., v¿} es una representación mínima del polítopo P si P = conv 
{vi,..., \k} y para cada i = 1 ,..., k, v¡ £ conv {y/: j A i). 


Cada polítopo tiene una representación mínima. Si P = conv {vi,..., V/ ¡ y si alguna v, 
es una combinación convexa de los otros puntos, entonces es posible eliminar v, del conjunto 
de puntos sin cambiar la envolvente convexa. Este proceso se puede repetir hasta obtener la 
representación mínima. Es factible demostrar que la representación mínima es única. 


I EO REMA 1 Suponga que M = { Vi,..., v¿} es la representación mínima del polítopo P. Entonces 

los siguientes tres enunciados son equivalentes: 

á) pe M. 

b) p es un vértice de P. 

c) p es un punto extremo de P. 


H' DEMOSTRACIÓN a) => b). Suponga que p e Aíy sea Q = conv {v : v e M y v A p}. De la 

definición de M se deduce que p g Q, y como Q es compacto, el teorema 13 implica la exis¬ 
tencia de un hiperplano H' que separa estrictamente {p} y Q. Sea Pl el hiperplano que pasa 
por p paralelo a PP. Véase la figura 2. 

Entonces Q está en uno de los semiespacios cerrados H + acotado por Pl, y P Q H + . 
Por lo tanto, H es soporte para P en p. Además, p es el único punto de P que puede estar 
en H, de manera que H Pl P = {p},ypesun vértice de P. 

b) =>■ c). Sea p un vértice en P. Entonces existe un hiperplano H = [/: d] tal que II D 
P = {p} y f(P) > d. Si p no fuera un punto extremo, entonces se tendrían puntos x y y en P 
tales que p = (1 — c)x + cy con 0 < c < 1. Es decir, 

cy = p—(l-c)x y y= Qj(p)-Q-lVx) 

Se deduce que /(y) = -/(p) — f-1 |/(x). Pero, /(p) = dy f(x) > d, por lo que 

c \c J 

f(y)< Q)(¿)-(^-iW) = ¿ 

Por otro lado, ye P, así que /(y) > d. Se deduce que /(y) = d y que y e H Í~1 P. Esto con¬ 
tradice el hecho de que p es un vértice. Entonces, p debe ser un punto extremo. (Observe 
que esta parte de la demostración no depende de que P sea un polítopo. Es válida para cual¬ 
quier conjunto convexo compacto). 

c) =>• a). Es claro que cualquier punto extremo de P debe ser un miembro de M. ■ 
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EJEMPLO 2 Recuerde que el perfil de un conjunto S es el conjunto de puntos extremos 
de S. El teorema 14 muestra que el perfil de un polígono en R 2 es el conjunto de vértices. 
(Véase la figura 3). El perfil de una bola cerrada es su frontera. Un conjunto abierto no tiene 
puntos extremos, de manera que su perfil es vacío. Un semiespacio cerrado no tiene puntos 
extremos, por lo que su perfil es vacío. ■ 



El ejercicio 18 le pide demostrar que un punto p en un conjunto convexo S es un punto 
extremo de S si, y solo si, cuando p se elimina de S. los puntos restantes aún siguen forman¬ 
do un conjunto convexo. Se deduce que si S* es cualquier subconjunto de S tal que conv S* es 
igual a S , entonces S* debe contener el perfil de S. Los conjuntos del ejemplo 2 muestran que, 
en general, S * puede ser más grande que el perfil de S. Sin embargo, es cierto que cuando S 
es compacto, S* se puede considerar como el perfil de S, como lo demostrará el teorema 15. 
Así, cada conjunto S compacto no vacío tiene un punto extremo, y el conjunto de todos los 
puntos extremos es el subconjunto más pequeño de S cuya envolvente convexa es igual a S. 


TEOREMA 15 Sea S un conjunto convexo compacto no vacío. Entonces S es la envolvente convexa 
de su perfil (el conjunto de puntos extremos de S ). 


DEMOSTRACIÓN La demostración es por inducción sobre la dimensión del conjun¬ 
to s . 1 m 

Una importante aplicación del teorema 15 es el siguiente teorema. Es uno de los re¬ 
sultados teóricos clave en el desarrollo de la programación lineal. Las funcionales lineales 
son continuas, y las funciones continuas siempre alcanzan sus máximos y mínimos sobre un 
conjunto compacto. El significado del teorema 16 es que para conjuntos convexos compactos, 
el máximo (y el mínimo) realmente se obtiene en un punto extremo de S. 


TEOREMA 16 Sea / una funcional lineal definida sobre un conjunto convexo S compacto y no vacío. 
Entonces, existen puntos extremos v y w de S tales que 

/(v) = máx/(v) y /(w) = mín/(v) 
veS veS 


DEMOSTRACIÓN Suponga que/alcanza su máximo m sobre S en algún punto v' en S. 
Es decir, /(v') = m. Se desea demostrar que existe un punto extremo en S con la misma pro¬ 
piedad. De acuerdo con el teorema 15, v' es una combinación convexa de los puntos extre¬ 
mos de S. Es decir, existen puntos extremos vi,.. V/ f de S y no negativos ci,..., c¿ tales que 

v' = CiVi + ••• + Ci¿Vk con Ci + ••• + Ck = 1 

Si ninguno de los puntos extremos de S satisface /(v) = m, entonces 

/(v,) < m para i = 1 , ..., k 


1 Los detalles se pueden encontrar en Steven R. Lay, Convex Sets and Their Applications (Nueva York: John Wiley & 
Sons, 1982; Mineóla, NY: Dover Publications, 2007, p. 43. 
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porque m es el máximo de / sobre S. Pero entonces, como / es lineal, 


m = f(V) = /(ciVi H-b c k \ k ) 

= Cl/(Vi) +-b c k f(v k ) 

< c\in + ■ ■ ■ + c k m = m{c\ + ■ ■ ■ + c k ) = m 

Esta contradicción implica que algún punto extremo v de S debe satisfacer /(v) = m. 

La demostración para w es similar. ■ 


EJEMPLO 3 


Dados los puntos = 



'-1' 


'3' 


T 

Pl = 

0 

’ p 2 = 

1 

y P 3 = 

2 


IR 2 , sea S = 


conv {pi, p 2 , P 3 }. Para cada funcional lineal /, encuentre el valor máximo m de / sobre 
el conjunto S, y obtenga todos los puntos x en S en los que /(x) = m. 


a) fi(x\,x 2 ) = x\ + x 2 b) f 2 (x\,x 2 ) = — 3xi + x 2 c) f 3 (x i,x 2 ) = x¡ + 2x 2 


SOLUCIÓN De acuerdo con el teorema 16, el valor máximo se alcanza en uno de los puntos 
extremos de S. Así que para encontrar m, se evalúa/en cada punto extremo y se selecciona 
el valor más grande. 

a ) /i(Pi) = —1, /i(p 2 ) = 4 y /iÍPí) = 3, de manera que m\ = 4. Trace la gráfica de la 
recta f\{x\, x 2 ) = m\, es decir, X\ + x 2 = 4, y observe que x = p 2 es el único punto en S 
en el cual /i(x) = 4. Véase la figura 4a). 

b ) / 2 (Pi) = 3, / 2 (p 2 ) = —8 y f 2 { p 3 ) = —1, por lo que ni\ = 3. Trace la gráfica de la recta 
f 2 (x \, x 2 ) = m 2 , es decir, — 3xi + x 2 = 3, y observe que x = p¡ es el único punto en S en 
el cual / 2 (x) = 3. Véase la figura 4b). 

c) /jlPi) = —1, f 3 (p 2 ) = 5 y yj(p 3 ) = 5, de manera que m\ = 5. Trace la gráfica de la 

recta f 2 (x\, x 2 ) = m 2 . es decir, xi + 2x 2 = 5. Aquí, f 2 alcanza su valor máximo en p 2 , 
en P 3 y en cada punto de la envolvente convexa de p 2 y P 3 . Véase la figura 4c). ■ 
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c ) x¡ + lx 2 = 5 


FIGURA 4 


La situación ilustrada en el ejemplo 3 para R 2 también se aplica en mayores dimensio¬ 
nes. El valor máximo de una funcional lineal / en un polítopo P está en la intersección de un 
hiperplano soporte y P. Esta intersección es un solo punto extremo de P, o bien, la envolvente 
convexa de 2 o más puntos extremos de P. En cualquier caso, la intersección es un polítopo, 
y sus puntos extremos forman un subconjunto de los puntos extremos de P. 

Por definición, un polítopo es la envolvente convexa de un conjunto finito de puntos. Esta 
es una representación explícita del polítopo porque identifica puntos en el conjunto. Un po¬ 
lítopo también se puede representar implícitamente como la intersección de un número finito 
de semiespacios cerrados. El ejemplo 4 ilustra esto en R 2 . 
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EJEMPLO 4 Sean 

-oí ni n- 

Pl = |_l} P2= [oJ y P3 = |. 2 _ 

en R 2 , y S = conv {pi, p 2 , P 3 }. Álgebra sencilla indica que la recta que pasa por pi y p 2 
está dada por X\ + X 2 = 1, y S está en el lado de esta recta donde 

x\ 4- X 2 — 1 o, de manera equivalente, —X\ — xo — —1. 

De forma similar, la recta que pasa por P 2 y P 3 es x¡ — *2 = I, y S está sobre el lado donde 

Xi - X2 =£ 1 

Además, la recta que pasa por p 3 y pi es —x\ + 3*2 = 3, y S se encuentra en el lado donde 

—*i + 3*2 — 3 

Véase la figura 5. Se deduce que S se puede describir como el conjunto solución del sistema 
de desigualdades lineales 

-*t - *2 < -1 

*i - *2 < 1 

—*i + 3*2 < 3 

Este sistema se puede escribir como Ax < b, donde 



Observe que una desigualdad entre dos vectores, tales como Ax y b, se aplica a cada una de 
las coordenadas correspondientes en esos vectores. ■ 

-V 


= 3 


FIGURA 5 

En ocasiones será necesario remplazar una descripción implícita de un polítopo por una 
representación mínima del polítopo, listando todos los puntos extremos del polítopo. En ca¬ 
sos sencillos, es factible una solución gráfica. El siguiente ejemplo muestra cómo manejar la 
situación cuando varios puntos de interés están muy cercanos para identificarlos fácilmente 
en una gráfica. 

EJEMPLO 5 Sea P el conjunto de puntos en R 2 que satisfacen Ax < b, donde 



y x > 0. Encuentre la representación mínima de P. 
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SOLUCIÓN La condición x > 0 coloca a P en el primer cuadrante de IR 2 , una condición 
típica en problemas de programación lineal. Las tres desigualdades en Ax < b implican tres 
rectas frontera: 


(1) x¡ + 3 x 2 = 18 (2) x\ + X 2 = 8 (3) 3xi + 2 x 2 = 21 

Las tres rectas tienen pendientes negativas, por lo que una idea general de la forma de P es 
fácil de visualizar. Incluso un burdo esquema de las gráficas de esas rectas revelará que (0, 0), 
(7, 0) y (0, 6 ) son vértices del polítopo P. 

¿Qué ocurre con las intersecciones de las rectas (1), (2) y (3)? A partir de la gráfica, 
algunas veces es claro cuáles intersecciones incluir. Si no es así, el siguiente procedimiento al¬ 
gebraico funcionará bien: 

Cuando se encuentra un punto de intersección que corresponde a dos desigualdades, 
pruébelo en las otras desigualdades para ver si el punto está en el polítopo. 

La intersección de (1) y (2) es pi 2 = (3, 5). Ambas coordenadas son no negativas, así que 
P 12 satisface todas las desigualdades, excepto quizá la tercera. Pruebe esto: 

3(3) + 2(5) = 19 < 21 

Este punto de intersección satisface la desigualdad para (3), de manera que pi 2 está en el 
polítopo. 

La intersección de (2) y (3) es P 23 = (5, 3). Esto satisface todas las desigualdades, excep¬ 
to quizá la desigualdad para (1). Pruebe esto: 

1(5) + 3(3) = 14 < 18 

Esto demuestra que P 23 está en el polítopo. 

y, y). Pruebe esto en la desigualdad 

para ( 2 ): 

1(t) + 1(t) = ?*8.6>8 

Por lo tanto, P 13 no satisface la segunda desigualdad, lo que demuestra que P 13 no está en P. 
En conclusión, la representación mínima del polítopo P es 



El resto de esta sección analiza la construcción de dos polítopos básicos en R 3 (y ma¬ 
yores dimensiones). El primero se presenta en problemas de programación lineal. Ambos 
polítopos brindan oportunidades para visualizar R 4 en una forma notable. 


Simplejo 

Un simplejo es la envolvente convexa de un conjunto finito de vectores afínmente indepen¬ 
dientes. Para construir un simplejo A-dimensional (o A-simplejo), se procede como sigue: 

0-simplejo S°: un solo punto {vi i 

1- simplejo S 1 : conv (5 o U {V 2 }), y V 2 no está en aff S° 

2- simplejo S 2 : conv (5 1 U {V 3 }), y V 3 no se encuentra en aff 5 1 


A-simplejo S k : conv ( S k 1 U {Vk+i}), y Vjí+i no está en aff S k 1 

El simplejo S l es un segmento de recta. El triángulo S 2 proviene de seleccionar un punto 
V 3 que no está en la recta que contiene a .S) y después formar la envolvente convexa con S 2 . 
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FIGURA 6 


(Véase la figura 6 ). El tetraedro se produce al elegir un punto V 4 que no esté en el plano de 
S 2 y después formar la envolvente convexa con S 2 . 

Antes de continuar, considere algunos de los patrones que se están presentando. El 
triángulo S 2 tiene tres aristas. Cada una de esas aristas es un segmento de recta semejante 
a S 1 . ¿De dónde provienen esos tres segmentos de recta? Uno de ellos es S l . Otro viene 
de la unión del punto final con el nuevo punto V3. El tercero proviene de unir el otro 
punto final vi con V3. Se podría decir que cada punto extremo en S 1 se estira dentro de un 
segmento de recta en S 2 . 

El tetraedro S 3 de la figura 6 tiene cuatro caras triangulares. Una de ellas es el trián¬ 
gulo original S 2 , y las otras tres se obtienen al estirar las aristas de S 2 al nuevo punto V4. 
Además, observe que los vértices de S 2 se estiran para formar las aristas de S 3 . Las otras 
aristas de S 3 provienen de las aristas de S 2 . Esto sugiere cómo “visualizar” el .S ' 4 de cuatro 
dimensiones. 

La construcción de S 4 , llamado pentatopo, implica formar la envolvente convexa de S 3 
con un punto V 5 que no está en el 3-espacio S 3 . Desde luego, es imposible un esquema com¬ 
pleto, pero la figura 7 es sugestiva: S 4 tiene cinco vértices, y cualesquiera cuatro de los vér¬ 
tices determinan una faceta en la forma de un tetraedro. Por ejemplo, la figura enfatiza 
la faceta con vértices vi, V2, V4 y V5 y la faceta con vértices V2, V3, V4 y V5. Hay cinco de estas 





FIGURA 7 El simplejo de cuatro dimensiones S 4 proyectado sobre IR 2 , con dos 
facetas tetraédricas resaltadas. 
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facetas. La figura 7 identifica las 10 aristas de S 4 , las cuales se pueden emplear para visua¬ 
lizar las 10 caras triangulares. 

La figura 8 muestra otra representación del simplejo de cuatro dimensiones S 4 . Esta vez 
el quinto vértice se presenta “dentro” del tetraedro .S' 3 . Las facetas tetraédricas resaltadas 
también parecen estar “dentro” de S 3 . 




Hipercubo 

Sea I¡ = Oe, el segmento de recta del origen 0 al vector e, de la base estándar en IR". Enton¬ 
ces, para k tal que 1 < k < n, el vector suma 2 

C k = h + I 2 + ••• + 4 


se llama el hipercubo ¿-dimensional. 

Para visualizar la construcción de C k , inicie con los casos sencillos. El hipercubo C 1 es el 
segmento de recta I\. Si C 1 se traslada mediante e 2 , la envolvente convexa de sus posiciones 
inicial y final describe un cuadrado C 2 . (Véase la figura 9 de la página 478). Al trasladar C 2 
mediante e 3 se produce el cubo C 3 . Una traslación similar de C 3 mediante el vector e 4 produce 
el hipercubo de cuatro dimensiones C 4 . 

Una vez más, esto es difícil de visualizar, pero la figura 10 muestra una proyección 
bidimensional de C 4 . Cada una de las aristas de C 3 se estira para formal’ una cara cuadrada 
de C 4 . Y cada cara cuadrada de C 3 se amplía para formar una cara cúbica de C 4 . La figura 
11 muestra tres facetas de C 4 . El inciso a ) resalta el cubo proveniente de la cara cuadrada iz¬ 
quierda de C 3 . El inciso tí) muestra el cubo que proviene de la cara cuadrada frontal de C 3 . 
Y el inciso c) destaca el cubo proveniente de la cara cuadrada superior de C 3 . 


2 El vector suma de dos conjuntos A y B se define mediante A + B = {c : c = a + b para algunas a e A y b e B). 










478 CAPÍTULO 8 Geometría de espacios vectoriales 


C 1 C 2 

FIGURA 9 Construcción del cubo C 3 . 


C 3 




FIGURA 10 C 4 proyectado sobre R 2 . 



La figura 12 muestra otra representación de C 4 en la que el cubo trasladado se coloca 
“dentro” de C 3 . Esto hace más fácil visualizar las facetas cúbicas de C 4 , porque existe menos 
distorsión. 



FIGURA 12 La imagen trasladada de 
C 3 se coloca “dentro” de C 3 para 
obtener C 4 . 


En total, el cubo de cuatro dimensiones C 4 tiene ocho caras cúbicas. Dos de ellas provie¬ 
nen de las imágenes originales y trasladadas de C 3 , y seis provienen de las caras cuadradas 
de C 3 que se amplían para formar cubos. Las caras cuadradas bidimensionales de C 4 pro¬ 
vienen de las caras cuadradas de C 3 y de su traslado, y las aristas de C 3 que se estiran para 
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formar cuadrados. Por lo tanto, hay 2x6+ 12 = 24 caras cuadradas. Para contar las aristas, 
multiplique por dos el número de aristas en C 3 y sume el número de vértices en C 3 . Esto 
da 2 x 12 + 8 = 32 aristas en C 4 . Todos los vértices en C 4 provienen de C 3 y su traslado, de 
manera que hay 2x8= 16 vértices. 

Uno de los resultados verdaderamente notables en el estudio de polítopos es la siguiente 
fórmula; Leonard Euler (1707-1783) fue el primero en probarla. La fórmula establece una 
relación sencilla entre el número de caras de diferentes dimensiones en un polítopo. Para 
simplificar el enunciado de la fórmula, sea f/-(P) el número de caras i-dimensionales de un 
polítopo «-dimensional P? 

n—1 

Fórmula de Euler: ^(— I ) k ft ( P) = 1 + (—1)" _1 

k=0 

En particular, cuando n = 3, v — e + f = 2, donde v, e y / denotan el número de vértices, 
aristas y facetas, respectivamente, de P. 


PROBLEMA DE PRÁCTICA 

1. Encuentre la representación mínima del polítopo P definido por las desigualdades 


Ax < b y x > 0, cuando A = 

1 

1 

3" 

2 

y b = 

12 

9 


2 

1 


12 


8.5 EJERCICIOS 


i. 


A partir de los puntos p 1 = 


1 


2 


-i 

0 

’ P 2 = 

3 

ypj = 

2 


en IR 2 , sea S = conv {pj, p^, P3¡. Para cada funcional lineal /, 
encuentre el valor máximo m de / en el conjunto S, y obtenga 
todos los puntos x en S en los cuales /(x) = m. 


a) f(x i, xi) = xi - X 2 b) f(x i, xi) = xi + X 2 


c) f(x i, x 2 ) = -3xi + x 2 


2 . 


Dados los puntos 



r 0' 


'2' 


' f 

Pt = 

-1 

,p 2 = 

1 

y p 3 = 

2 


en IR 2 , 


sea 5 = conv ¡pi, P 2 , P 3 }. Para cada funcional lineal/, encuen¬ 
tre el valor máximo m de / en el conjunto 5, y determine todos 
los puntos x en S en los cuales /(x) = m. 


a) f{x i, xi) = xi + x 2 b) f(x i, xi) = xi - x 2 
c) f(x i, x 2 ) = —2x\ + x 2 


6 . 



7. A = 


1 

1 

4 


8. A = 


2 

1 

1 



9. Sea S = {(x, y) : x 2 + (y - l) 2 < 1} < {(3, 0)j. ¿El origen 
es un punto extremo de conv 57 ¿Es el origen un vértice de 
conv 5? 

10. Encuentre un ejemplo de un conjunto convexo S cerrado en IR 2 
tal que su perfil P sea no vacío, pero conv P A S. 


3. Repita el ejercicio 1 considerando que m es el valor mínimo 
de / en S y no el valor máximo. 

4. Repita el ejercicio 2 considerando que m es el valor mínimo de 
/ en S y no el valor máximo. 

En los ejercicios 5 a 8, encuentre la representación mínima del po¬ 
lítopo definido por las desigualdades Ax £ b y x S 0. 


" 1 

2" 


" 10' 

3 

1 

, b = 

15 


11. Encuentre un ejemplo de un conjunto convexo S acotado en 
IR 2 tal que su perfil P sea no vacío, pero conv P + 5. 

12. a) Determine el número de i-caras del simplejo de cinco di¬ 

mensiones S 5 para k = 0, 1,.... 4. Verifique que su respuesta 
satisfaga la fórmula de Euler. 

b) Realice una tabla de los valores de fk(S") para n = 1,..., 5 
y k = 0, 1,..., 4. ¿Identifica un patrón? Proponga una fórmu¬ 
la general para fk(S n ). 


3 Se presenta una demostración en Steven R. Lay, Com/ex Sets and Their Applications (Nueva York: John Wiley & 
Sons, 1982; Mineóla, NY: Dover Publications, 2007), p. 131. 
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13. a) Determine el número de ¿-caras del hipercubo de cinco di¬ 

mensiones C 5 para k — 0, 1,..., 4. Compruebe que su res¬ 
puesta satisfaga la fórmula de Euler. 

b) Construyauna tabla de los valores de ft(C") para n = 1,...,5 
y ¿ = 0, 1.....4. ¿Identifica un patrón? Proponga una fórmu¬ 
la general para fk(C n ). 

14. Suponga que Vi,..., v^ son vectores linealmente indepen¬ 
dientes en IR” (1 < ¿ < ti). Entonces el conjunto X k = conv 
{ ±vi,..., ±\k 1 es un ¿-polítopo de cruce (u ortoplex). 

a) Elabore un bosquejo de X 1 y X 2 . 

b) Determine el número de Ir-caras del polítopo de cruce tridi¬ 
mensional X 3 para k = 0, 1, 2. ¿Qué otro nombre tiene X 3 ? 

c) Obtenga el número de ¿-caras del polítopo de cruce de cua¬ 
tro dimensiones X 4 para k = 0, 1, 2, 3. Compruebe que su 
respuesta satisfaga la fórmula de Euler. 

d) Encuentre una fórmula para fk(X n ), el número de ¿-caras 
de X", para 0 < ¿ < n — 1. 

15. Una ¿-pirámide P k es la envolvente convexa de un (¿ — 1)- 
polítopo Q y un punto x i aff Q. Encuentre una fórmula 
para cada uno de los siguientes casos en términos de f¡(Q ), 
j = 0 n - 1 . 

a) El número de vértices de P" : fo(P n ). 

b) El número de ¿-caras de P n : fk(P"), para l<i<n-2. 

c) El número de facetas (n — l)-dimensionales de P n : 

f„-i(P n )• 

En los ejercicios 16 y 17, marque cada enunciado como verdadero 
o falso. Justifique sus respuestas. 

16. a) Un polítopo es la envolvente convexa de un conjunto finito 

de puntos. 

b) Sea p un punto extremo de un conjunto convexo S. Si u, 
veS, p € ñv y p 4 u, entonces p = v. 

c) Si S es un subconjunto convexo no vacío de R", entonces S 
es la envolvente convexa de su perfil. 

d) El simplejo de cuatro dimensiones S 4 tiene exactamente 
cinco facetas, cada una de las cuales es un tetraedro tridi¬ 
mensional. 


17. a) Un cubo en R 3 tiene cinco facetas. 

tí) Un punto p es un punto extremo de un polítopo P si y solo 
si p es un vértice de P. 

c) Si S es un conjunto convexo, compacto y no vacío, y una 
funcional lineal alcanza su máximo en un punto p, entonces 
p es un punto extremo de S. 

d) Un polítopo bidimensional siempre tiene el mismo número 
de vértices y aristas. 

18. Sea v un elemento del conjunto convexo S. Pruebe que v es un 
punto extremo de 5 si y solo si el conjunto [x e S : x vj es 
convexo. 

19. Si c e R y S es un conjunto, defina cS = {ex : x e X). Sea S 
un conjunto convexo y suponga que c > 0 y d > 0. Demuestre 
que cS + dS — (c + d)S. 

20. Encuentre un ejemplo para demostrar que la convexidad de S 
es necesaria en el ejercicio 19. 

21. Si A y B son conjuntos convexos, demuestre que A + B es 
convexo. 

22. Un poliedro (3-polítopo) se llama regular si todas sus facetas 
son polígonos regulares congruentes y todos los ángulos en los 
vértices son iguales. En la siguiente demostración aporte los de¬ 
talles de que solamente existen cinco poliedros regulares. 

a) Suponga que un poliedro regular tiene r facetas, cada una de 
las cuales es un polígono regular de ¿ lados, y que s aristas 
concurren en cada vértice. Considerando que v y e denotan 
los números de vértices y aristas en el poliedro, explique por 
qué kr = 2e y sv = 2e. 

tí) Utilice la fórmula de Euler para demostrar que 

lili 

“ + 7 — ~ + “• 
s k 2 e 

c) Obtenga todas las soluciones integrales de la ecuación en 
el inciso tí) que satisfacen las restricciones geométricas del 
problema. (¿Qué tan pequeños pueden ser k y si). 

Para su información, los cinco poliedros regulares son el tetrae¬ 
dro (4, 6, 4), el cubo (8, 12, 16), el octaedro (6, 12, 8), el dode¬ 
caedro (20, 30, 12) y el icosaedro (12, 30, 20). (Los números 
entre paréntesis indican los números de vértices, aristas y caras, 
respectivamente). 


SOLUCIÓN AL PROBLEMA DE PRÁCTICA 

1. La desigualdad matricial Ax < b conduce al siguiente sistema de desigualdades: 

a) X\ + 3 x 2 — 12 

b) x¡ + 2x2 — 9 

c) 2xi + ,\2 ^ 12 

La condición x > 0 coloca al polítopo en el primer cuadrante del plano. Un vértice es 
(0, 0). Las x\ de intersección de las tres rectas (cuando X 2 = 0) son 12, 9 y 6, por lo 
que (6, 0) es un vértice. Las X 2 de intersección de las tres rectas (cuando x\ = 0) son 4, 
4.5, y 12, de manera que (0, 4) es un vértice. 
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¿Cómo hacer que las tres rectas frontera intercepten en valores positivos de x\ y x{\ 
La intersección de d) y b) está en p a b = (3, 3). Al probar p a b en c) se obtiene 2(3) + 1(3) = 
9 < 12, por lo que p a b está en P. La intersección de b) y c) está en pb C = (5, 2). Al probar 
Pbc en a) se obtiene 1(5) + 3(2) = 11 < 12, de manera que pb c está en P. La intersección 
de a) y c) está en p ac = (4.8, 2.4). Al probar p ac en b) se obtiene 1(4.8) + 2(2.4) = 9.6 > 9. 
Así, p ac no está en P. 

Por último, los tres vértices (puntos extremos) de los polítopos son (0, 0), (6, 0), (5, 2), 
(3, 3) y (0, 4). Esos puntos forman la representación mínima de P. Esto se muestra gráfica¬ 
mente en la figura 13. 
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FIGURA 13 


8.6 CURVAS Y SUPERFICIES 


Durante miles de años, los constructores utilizaron largas tiras delgadas de madera para 
formar el casco de las embarcaciones. En épocas más recientes, los diseñadores emplearon 
tiras metálicas largas y flexibles para formar las superficies de autos y aviones. Pesos y 
clavijas moldearon las tiras en suaves curvas llamadas splines cúbicos naturales. La curva 
entre dos puntos de control sucesivos (clavijas o pesos) tiene una representación paramé¬ 
trica usando polinomios cúbicos. Por desgracia, dichas curvas tienen la propiedad de que 
el movimiento de un punto de control afecta la forma de toda la curva, debido a las fuerzas 
físicas que las clavijas y los pesos ejercen sobre la tira. Los ingenieros diseñadores habían 
deseado por mucho tiempo tener un gran control local de la curva, de manera que el movi¬ 
miento de un punto de control afectara solamente una pequeña parte de la curva. En 1962, 
un ingeniero francés especialista en automotores, Pierre Bézier, resolvió este problema 
agregando puntos de control y utilizando una clase especial de curvas, las cuales ahora 
llevan el nombre de su creador. 


Curvas de Bézier 

Las curvas que se describen a continuación desempeñan un papel importante en los gráficos 
generados por computadora y en ingeniería. Por ejemplo, se emplean en Adobe Illustrator y 
en Macromedia Freehand, y en lenguajes de programación como OpenGL. Esas curvas le 
permiten a un programa almacenar información exacta sobre segmentos curvos y superficies 
en un número relativamente pequeño de puntos de control. Todos los comandos de gráficos 
para los segmentos y las superficies solo se tienen que calcular para los puntos de control. La 
estructura especial de esas curvas también acelera otros cálculos en la “tubería de gráficos” 
que crea la imagen final en la pantalla. 

Los ejercicios de la sección 8.3 introdujeron las curvas cuadráticas de Bézier y mos¬ 
traron un método para construir curvas de Bézier de grado superior. Aquí el análisis se 
concentra en las curvas de Bézier cuadráticas y cúbicas, que se determinan con tres o cuatro 
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puntos de control, denotados como po, pi, P 2 y P 3 - Esos puntos pueden estar en IR 2 o IR 3 , 
o bien, representarse mediante formas homogéneas en IR 3 o IR 4 . Las descripciones paramé- 
tricas estándares de esas curvas, para 0 < t < 1, son 

w(r) = (1 - /) 2 Po + 2 r(l - t)Pi + rp 2 (1) 

X(r) = (1 - f) 3 p 0 + 3 í(l - f) 2 p! + 3í 2 (1 - í)p 2 + f3 P 3 ( 2 ) 

La figura 1 muestra dos curvas típicas. Por lo regular, las curvas pasan solo a través de los 
puntos de control inicial y final, pero una curva de Bézier siempre está en la envolvente con¬ 
vexa de sus puntos de control. (Véase los ejercicios 21 a 24 de la sección 8.3). 



Po* Po* * P 3 

FIGURA 1 Curvas de Bézier cuadráticas y cúbicas. 

Las curvas de Bézier son útiles en los gráficos generados por computadora porque sus 
propiedades esenciales se preservan bajo la acción de transformaciones lineales y traslacio¬ 
nes. Por ejemplo, si A es una matriz de tamaño adecuado, entonces de la linealidad de la 
multiplicación de matrices, para 0 < t < 1, 

¿x(f) = ^[(1 — r) 3 p 0 -i- 3í(l — r) 2 P! + 3í 2 (1 — í)p 2 + í 3 p 3 ] 

= (1 — f) 3 Ap 0 + 3í(l — t) 2 A\> x + 3í 2 (l — t ) Ap 2 + ? 3 Ap 3 

Los nuevos puntos de control son Apo,..., Ap 3 . En el ejercicio 1 se consideran traslaciones 
de curvas de Bézier. 

Las curvas de la figura 1 sugieren que los puntos de control determinan las rectas tan¬ 
gentes a las curvas en los puntos de control inicial y terminal. De sus clases de cálculo, recuer¬ 
de que para cualquier curva paramétrica, por ejemplo y(f), la dirección de la recta tangente 
a la curva en un punto y(r) está dada por la derivada y'(í), llamada vector tangente de la 
curva. (Esta derivada se calcula entrada por entrada). 

EJEMPLO 1 Determine cómo el vector tangente de la curva cuadrática de Bézier w(í) 
está relacionado con los puntos de control de la curva, en t = 0 y t = 1. 

SOLUCIÓN Escriba los pesos en la ecuación (1) como simples polinomios 
w(r) = (1 - 2í + í 2 )p 0 + (2 1 - 2r 2 )p 1 + í 2 p. 

Entonces, ya que la derivación es una transformación lineal sobre funciones, 

w '(t) = (-2 + 2t )p 0 + (2 - 4í)p 3 + 2rp, 


Así, 


w'(0) = — 2p 0 + 2p! = 2(pj - p 0 ) 
w'(l) = — 2pi + 2p, = 2(p 2 - pj 


El vector tangente en po, por ejemplo, apunta de po a p¡, pero es dos veces más largo que 
el segmento de po a p 3 . Observe que w'(0) = 0 cuando pi = po. En este caso, w (t) =(1 — t 1 ) 
Pi + í 2 p 2 , y la gráfica de wír) es el segmento de recta de pi a p 2 . ■ 
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Conexión de dos curvas de Bézier 

Dos curvas de Bézier básicas se pueden unir extremo con extremo, con el punto terminal 
de la primera curva x(í) como el punto inicial P 2 de la segunda curva y(r). Se dice que la cur¬ 
va combinada tiene continuidad geométrica G° (en pj) porque los dos segmentos se juntan 
en p 2 . Si la recta tangente a la curva 1 en p 2 tiene diferente dirección que la recta tangente 
a la curva 2, entonces una “esquina”, o un cambio abrupto de dirección, puede ser eviden¬ 
te en p 2 . Véase la figura 2. 


P 3 t-—-*P 4 


Po 

FIGURA 2 Continuidad G° en p 2 . 


Para evitar un doblez pronunciado, es suficiente ajustar las curvas para que tengan lo 
que se llama continuidad geométrica G 1 , donde ambos vectores tangentes en p 2 apuntan en 
la misma dirección. Es decir, las derivadas x'(l) y y'(0) apuntan en la misma dirección, 
aunque pueden diferir en magnitud. Cuando los vectores tangentes son realmente iguales 
en p 2 , el vector tangente es continuo en p 2 , y se dice que la curva combinada tiene conti¬ 
nuidad C 1 , o continuidad paramétrica C 1 . La figura 3 muestra continuidad G 1 en a) y con¬ 
tinuidad C 1 en b). 



a) b) 

FIGURA 3 a) Continuidad G 1 y b) continuidad C 1 . 


EJEMPLO 2 Considere que x(r) y y(r) determinan dos curvas cuadráticas de Bézier, 
con puntos de control {po, Pi, P 2 } y ÍP 2 > P?- p 4 }, respectivamente. Las curvas se unen en 
p 2 = x(l) = y(0). 

a) Suponga que la curva combinada tiene continuidad G 1 (en P 2 ). ¿Qué restricción alge¬ 
braica hace que esta condición se imponga sobre los puntos de control? Exprese esta 
restricción en lenguaje geométrico. 

b ) Repita el inciso a) para continuidad C 1 . 

SOLUCIÓN 

a) A partir del ejemplo 1, x'(f) = 2(p2 — pi). Además, utilizando los puntos de control para 
y (t) en lugar de w(í), el ejemplo 1 indica que y'(0) = 2(p 3 — P 2 ). La continuidad G 1 sig¬ 
nifica que y'(0) = fcx'(l) para alguna constante positiva k. De forma equivalente, 


p 3 - p 2 = k(p 2 - Pi), con k > 0 


(3) 
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Geométricamente, ( 3 ) implica que p2 está sobre el segmento de recta de pi a P3. Para 
probar esto, sea t = (k + I) ', y observe que 0 < t < 1 . Despeje k, para obtener k = 
(1 — t)/t. Cuando esta expresión para k se emplea en la ecuación ( 3 ), un reordenamiento 
indica que P2 = (1 — f)Pi + t p3, lo que comprueba la afirmación acerca de p2. 
b) La continuidad C 1 significa que y'( 0 ) = x'(l). Por lo tanto, 2 (p f — P2) = 2(p2 — pi), 
de manera que P3 — P2 = P2 — pi, y P2 = (pi + p3)/2. Geométricamente, p2 es el 
punto medio del segmento de recta de p¡ a P3. Véase la figura 3 . ■ 

La figura 4 muestra la continuidad C 1 para dos curvas cúbicas de Bézier. Observe cómo 
el punto que une los dos segmentos de recta está a la mitad del segmento de recta entre los 
puntos de control adyacentes. 



P 6 

FIGURA 4 Dos curvas cúbicas de Bézier. 


Dos curvas tienen continuidad (paramétrica) C 2 cuando tienen continuidad C 1 y las se¬ 
gundas derivadas x"(l) y y"( 0 ) son iguales. Esto es posible para curvas cúbicas de Bézier, 
pero limita severamente las posiciones de los puntos de control. Otra clase de curvas cúbicas, 
llamadas B-splines, siempre tienen continuidad C 2 porque cada par de curvas comparte tres 
puntos de control en lugar de uno. Los gráficos que utilizan B-splines tienen más puntos de 
control y, en consecuencia, requieren más cálculos. Algunos ejercicios de esta sección exa¬ 
minan esas curvas. 

De manera sorprendente, si x(f) y y (t) se unen en P3, la suavidad aparente de la curva 
en p3, por lo general, es la misma para continuidad G 1 y continuidad C 1 . Esto se debe a que 
la magnitud de x'(f) no está relacionada con la forma física de la curva. La magnitud solo 
refleja la parametrización matemática de la curva. Por ejemplo, si una nueva función vectorial 
z (í) es igual a x(2 1 ), entonces el punto z(f) atraviesa la curva de po a P3 dos veces más rápido 
que la versión original, porque 2 1 alcanza 1 cuando t es . 5 . Pero, de acuerdo con la regla de 
la cadena de cálculo, z'(f) = 2-x'(2í), por lo que el vector tangente a z(f) en P3 es el doble 
del vector tangente a x(í) en P3. 

En la práctica, muchas curvas de Bézier sencillas se unen para crear objetos gráficos. 
Los programas de composición tipográfica constituyen una importante aplicación, porque 
muchas letras en un tipo de fuente implican segmentos curvos. Cada letra en letra Post¬ 
Script®, por ejemplo, se almacena como un conjunto de puntos de control, junto con infor¬ 
mación sobre cómo construir el “contorno” de la letra utilizando segmentos de recta y cur¬ 
vas de Bézier. El aumento de dicha letra básicamente requiere multiplicar las coordenadas 
de cada punto de control por un factor de escala constante. Una vez que se ha calculado el 
contorno de la letra, se rellenan las partes sólidas adecuadas de la letra. La figura 5 ilustra 
esto para un carácter de una letra PostScript. Observe los puntos de control. 
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FIGURA 5 Un carácter PostScript. 


Ecuaciones matriciales para curvas de Bézier 

Como una curva de Bézier es una combinación lineal de puntos de control utilizando polino¬ 
mios como pesos, la fórmula para x(f) se puede escribir como 


x(í) = [p 0 Pi 


P2 


P 3 ] 


r a-o 3 " 

3í(l -t) 2 
3í 2 (1 - 1) 
í 3 


= [Po Pi 


= [Po Pi 


P2 


P2 


P 3 ] 

P 3 ] 


1 - 3r + 3í 2 - í 3 ” 

3r - 6t 2 + 3 1 3 
3t 2 - 3í 3 
f 3 

1-3 3 —inri 

03-63 t 
0 0 3 -3 t 2 

0 0 0 1 í 3 


La matriz cuyas columnas son los cuatro puntos de control es la matriz de geometría, 
G. La matriz de 4 x 4 de coeficientes polinomiales es la matriz base de Bézier, M H . Si u(r) 
es el vector columna de potencias de t, entonces la curva de Bézier está dada por 

x(f) = GM B u(r) (4) 

Otras curvas cúbicas paramétricas en gráficos de computadora también se escriben en 
esta forma. Por ejemplo, si las entradas en la matriz se cambian adecuadamente, las cur¬ 
vas resultantes son B-splines. Estas son “más suaves” que las curvas de Bézier, pero no pasan 
por ninguno de los puntos de control. Una curva cúbica de Hermite se presenta cuando la 
matriz Mb se remplaza por una matriz base de Hermite. En este caso, las columnas de la ma¬ 
triz de geometría consisten en los puntos inicial y final de las curvas y los vectores tangentes 
a las curvas en esos puntos. 1 

La curva de Bézier en la ecuación (4) se puede “factorizar” de otra manera, para utili¬ 
zarse en el análisis de superficies de Bézier. Por conveniencia más adelante, el parámetro t 


1 El término matriz base viene de las filas de la matriz que listan los coeficientes de los polinomios de mezclado 
utilizados para definir la curva. Para una curva de Bézier cúbica, los cuatro polinomios son (1 — f) 3 , 3/(1 — t) 2 , 
3/ 2 (l — /), y / 3 . Estos forman una base para el espacio P 3 de polinomios de grado 3 o menor. Cada entrada en el 
vector x(/) es una combinación lineal de esos polinomios. Los pesos provienen de las filas de la matriz de geome¬ 
tría G en la ecuación (4). 




486 


CAPITULO 8 


Geometría de espacios vectoriales 


se remplaza por un parámetro ,v: 


xO ) = vl(s) t M¡ 


Po 

Pi 

P 2 

P 3 


[1 


s s 


1 

-3 

3 

-1 


[(l-s) 3 3 í(1-í) 2 3í 2 (1-5) s 3 ] 


Po 

Pi 

P 2 

P 3 



Po 


Pl 


p 2 


_ p 3 _ 


(5) 


Esta fórmula no coincide plenamente con la transpuesta del producto de la derecha 
en (4), porque x(.y) y los puntos de control se presentan en la ecuación (5) sin los símbolos 
de transpuesta. La matriz de los puntos de control en la ecuación (5) se llama el vector de 
geometría. Esto se debería ver como un bloque matricial de 4 x 1 (particionado) cuyas 
entradas son vectores columnas. La matriz a la izquierda del vector de geometría, en la se¬ 
gunda parte de la ecuación (5), también se puede considerar como un bloque matricial, con 
un escalar en cada bloque. La multiplicación de matrices particionadas tiene sentido, por¬ 
que cada entrada (vector) en el vector de geometría se puede multiplicar por la izquierda 
por un escalar, así como por una matriz. Por lo tanto, el vector columna x(,v) se representa 
mediante la ecuación (5). 


Superficies de Bézier 

Un parche superficial bicúbico en 3D se puede construir a partir de un conjunto de cuatro 
curvas de Bézier. Considere las cuatro matrices de geometría 


[Pll 

Pl 2 

Pl 3 

P 14 ] 

[p 2 l 

P 22 

P 23 

P 24 ] 

[p 3 l 

P 32 

P 33 

P 34 ] 

[P41 

P 42 

P 43 

P 44 ] 


y recuerde de la ecuación (4) que una curva de Bézier se produce cuando cualquiera de esas 
matrices se multiplica por la derecha por el siguiente vector de pesos: 


M B u(t ) = 


(l - O 3 
3/(1 - /) 2 
3/ 2 (l - /) 


Sea G el bloque matricial (particionado) de 4 x 4 cuyas entradas son los puntos de con¬ 
trol Py presentados antes. Entonces, el siguiente producto es un bloque matricial de 4 x 1, 
y cada entrada es una curva de Bézier: 


De hecho. 


GM B u(t) = 


"Pll 

Pl 2 

Pl 3 

Pl 4 " 


r (i-í) 3 - 

P 2 1 

P 22 

P 23 

P 24 


3/(1 -í) 2 

P 3 1 

P 32 

P 33 

P 34 


3/ 2 (l — /) 

_P 4 1 

P 42 

P 43 

P 44 _ 


L / 3 


(1 - 0 3 Pn + 3/(1 - 0 2 P 12 + 3/ 2 (l - /)p 13 + / 3 p 14 

(1 - /) 3 p 21 + 3/(1 - /) 2 p 22 + 3/ 2 (l - /)p 23 + í 3 P 24 

(1 - 0 3 P 3 i + 3/(1 - /) 2 p 32 + 3/ 2 (l - /)p 33 + / 3 p 34 

(1 - zj 3 p 41 + 3/(1 - /) 2 p 42 + 3/ 2 (l - í)p 43 + í 3 p 44 


GM B u(t) = 
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Ahora fije t. Así, GM¡¡u(t) es un vector columna que se puede utilizar como un vector de 
geometría en la ecuación (5) para una curva de Bézier en otra variable s. Esta observación 
produce la superficie bicúbica de Bézier: 

x(.s', t ) = u (s) t m£ GMbu(í), donde 0 < s, t < 1 (6) 

La fórmula para x(.y, t) es una combinación lineal de los 16 puntos de control. Si uno ima¬ 
gina que esos puntos de control están acomodados en un arreglo rectangular más o menos 
uniforme, como en la figura 6 , entonces la superficie de Bézier se controla con una red de 
ocho curvas de Bézier, cuatro en la “dirección s” y cuatro en la “dirección t”. La superfi¬ 
cie realmente pasa por los cuatro puntos de control en sus “esquinas”. Cuando está a la 
mitad de una superficie más grande, la superficie de 16 puntos comparte con sus vecinos sus 
12 puntos de control frontera. 


P21 P11 



FIGURA 6 Dieciséis puntos de control para un 
parche superficial bicúbico de Bézier. 


Aproximaciones a curvas y superficies 

En programas CAD y en los que se utilizan para crear juegos computacionales realistas, el 
diseñador con frecuencia labora en una estación de trabajo gráfica para crear una “escena” 
que implica varias estructuras geométricas. Este proceso requiere interacción entre el dise¬ 
ñador y los objetos geométricos. Cada leve reposicionamiento de un objeto requiere nuevos 
cálculos matemáticos por el programa de gráficos. Las curvas y superficies de Bézier son 
útiles en este proceso porque implican mucho menos puntos de control que objetos aproxi¬ 
mados por bastantes polígonos. Esto reduce notablemente el tiempo de cálculo y acelera el 
trabajo del diseñador. 

Sin embargo, después de la composición de la escena, la preparación de la imagen final 
tiene diferentes demandas computacionales que se logran con mayor facilidad mediante ob¬ 
jetos que consisten en superficies planas y aristas rectas, como los poliedros. El diseñador 
necesita generar la escena, introduciendo iluminación, agregando color y textura a las super¬ 
ficies, y simulando reflexiones en las superficies. 

Calcular la dirección de la luz reflejada en un punto p sobre una superficie, por ejemplo, 
requiere saber las direcciones de la luz incidente y de la normal superficial , esto es, el vector 
perpendicular al plano tangente en p. Determinar estos vectores normales es mucho más fácil 
sobre una superficie compuesta de, por ejemplo, pequeños polígonos planos que sobre una 
superficie curva cuyo vector normal cambia continuamente conforme se mueve p. Si pi, P 2 
y P 3 son vértices adyacentes de un polígono plano, entonces la normal superficial es más o 
menos el producto cruz (P2 — pi) x (pj — P3). Cuando el polígono es pequeño, solo se nece¬ 
sita un vector normal para reproducir el polígono entero. Además, dos rutinas de sombreado 
ampliamente utilizadas, el sombreado Gouraud y el sombreado Phong, requieren una super¬ 
ficie para definirse mediante polígonos. 

Como resultado de esa necesidad de superficies planas, ahora las curvas y superficies 
de Bézier de la etapa de composición de escenas generalmente se aproximan mediante seg- 
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mentos de líneas rectas y superficies poliédricas. La idea básica para aproximar una curva o 
superficie de Bézier es dividir la curva o superficie en partes más pequeñas, con más y más 
puntos de control. 

Subdivisión recursiva de curvas y superficies de Bézier 

La figura 7 muestra los cuatro puntos de control po,..., P 3 para una curva de Bézier, junto con 
puntos de control para dos nuevas curvas, cada una de las cuales coincide con la mitad de la 
curva original. La curva "izquierda” inicia en qo = Po y termina en q 3 , en el punto medio de 
la curva original. La curva "derecha” comienza en ro = q 3 y termina en r 3 = P 3 . 



FIGURA 7 Subdivisión de una curva de Bézier. 


La figura 8 muestra cómo los nuevos puntos de control encierran regiones que son "más 
delgadas” que la región encerrada por los puntos de control originales. Conforme las dis¬ 
tancias entre los puntos de control disminuyen, los puntos de control de cada segmento de 
curva también se hacen más cercanos a un segmento de recta. Esta propiedad de variación- 
disminución de las curvas de Bézier depende del hecho de que una curva de Bézier siempre 
está en la envolvente convexa de los puntos de control. 



Los nuevos puntos de control están relacionados con los puntos de control originales me¬ 
diante fórmulas sencillas. Desde luego, qo = Po y r 3 = P 3 . El punto medio de la curva original 
x(t) se encuentra en x(.5) cuando x(t) tiene la parametrización estándar. 

x(zj = (1 -3 1 + 3 1 2 - í 3 )Po + (3r - 6 1 1 + 3í 3 )p, + (3í 2 - 3/ 3 )p 2 + r 3 p 3 (7) 

para 0 < í < 1. Así, los nuevos puntos de control q 3 y ro están dados por 

q 3 = r 0 = x(.5) = g(p 0 + 3p, + 3p, + p 3 ) (8) 

También son sencillas las fórmulas para los restantes puntos de control "interiores”, pero la 
deducción de las fórmulas requiere algún trabajo que implica vectores tangentes de las curvas. 
Por definición, el vector tangente a una curva parametrizada x(f) es la derivada x'(f). Este vec¬ 
tor muestra la dirección de la recta tangente a la curva en x(f). Para la curva de Bézier en (7), 

x'(í) = (-3 + 6 1 — 3r)p 0 + (3 - 12 1 + 9í 2 )P! + ( 6 1 - 9f 2 )p 2 + 3r 2 p 3 

para 0 < í < 1. En particular, 


x'(O) = 3(p,-p 0 ) y x'(l) = 3(p 3 - p 2 ) 


(9) 
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Geométricamente, p¡ está sobre la recta tangente a la curva en po, y P 2 está sobre la recta 
tangente a la curva en P 3 . Véase la figura 8 . Además, a partir de x’(t), calcule 

x'(-5) = iÍ-Po-P! +P 2 + P 3 ) (10) 

Sean y(7) la curva de Bézier determinada por qo,..., q 3 , y z(f) la curva de Bézier determinada 
por ro,..., r 3 . Como y(r) recorre la misma trayectoria que x(r), pero solo llega hasta x(.5) 
conforme t va de 0 a 1, entonces y(f) = x(.5í) para 0 < í < 1. De manera similar, ya que 
z(r) inicia en x(,5) cuando t = 0, entonces z (t)= x(.5 + .5 1) para 0 < í < 1. De acuerdo con 
la regla de la cadena para derivadas, 

y')?) = .5x'(.5f) y z'(í) = ,5x'(.5 + ,5í) para 0 < t < 1 (11) 

A partir de (9) con y'(0) en vez de x'(O), de (11) con t = 0, y de (9), los puntos de control 
para y(í) satisfacen 

3(Qi -q 0 ) = y'(0) = .5x'(0) = |(pj -p 0 ) ( 12 ) 

A partir de (9) con y'(l) en vez de x'(l), de (11) con t = 1, y de (10), 

3(q 3 - q 2 ) = y'(l) = -5 x'(. 5) = |(—Po - Pi + P 2 + P 3 ) (13) 

Las ecuaciones ( 8 ), (9), (10), (12) y (13) se pueden resolver y así generar las fórmulas para 
qo,..., q 3 que se muestran en el ejercicio 13. Geométricamente, las fórmulas se presentan en 
la figura 9. Los puntos de control interiores qi y r 2 son los puntos medios, respectivamente, 
del segmento de po a pi y el segmento de p 2 a p 3 . Cuando el punto medio del segmento de 
Pi a p 2 se conecta a qi, ¡el segmento de recta resultante tiene a q 2 como punto medio! 


Í(Pi + P 2 ) 



control. 

Esto completa un paso del proceso de subdivisión. La “recursión” inicia, y las nuevas curvas 
se subdividen. La recursión continúa a una profundidad en la cual todas las curvas son lo sufi¬ 
cientemente rectas. De manera alternativa, en cada paso la recursión puede ser “adaptiva” y no 
subdividir una de las dos nuevas curvas si esa curva es suficientemente recta. Una vez que la sub¬ 
división se detiene por completo, los puntos extremos de cada curva se unen mediante segmentos 
de recta, y la escena está lista para el siguiente paso en la preparación de la imagen final. 

Una superficie bicúbica de Bézier tiene la misma propiedad de variación-disminución 
que las curvas de Bézier que forman cada sección transversal de la superficie, de manera que 
el proceso ya descrito se puede aplicar en cada sección transversal. Omitiendo los detalles, a 
continuación se presenta la estrategia básica. Considere las cuatro curvas de Bézier “parale¬ 
las” cuyo parámetro es s , y aplique el proceso de subdivisión a cada una de ellas. Esto produce 
cuatro conjuntos de ocho puntos de control; cada conjunto determina una curva conforme s 
varía de 0 a 1. Sin embargo, al variar t, existen ocho curvas, cada una con cuatro puntos de 
control. Aplique el proceso de subdivisión a cada uno de esos conjuntos de cuatro puntos, 
para crear un total de 64 puntos de control. La recursión adaptiva también es posible en este 
caso, pero hay algunas sutilezas implicadas. 2 


2 Véase Foley, Van Dam, Feiner y Hughes, Computer Graphics—Principies and Practice, 2a. ed. (Boston: Addison- 
Wesley, 1996), pp. 527-528. 
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PROBLEMAS DE PRÁCTICA 

El término spline generalmente se refiere a una curva que pasa por puntos especificados. Sin 
embargo, una B-spline, normalmente no pasa a través de sus puntos de control. Un solo seg¬ 
mento tiene la forma paramétrica 

x (0 = g[(l - 0 3 Po + ( 3f3 - 6f2 + 4 )Pt 

+ (-3? 3 + 3í 1 2 + 3í + l)p 2 + f 3 p 3 ] 

para 0 < t < 1, donde po, pi, P 2 y P 3 son los puntos de control. Cuando t varía de 0 a 1, 
x(t) crea un curva corta cercana a p,p 2 . Álgebra básica indica que la fórmula de B-spline 
también se puede escribir como 

x(0 = g[(l - 0 3 Po + (3í(l - rf -3 1 + 4)p, 

+ (3í 2 (l — í) + 3í + l)p 2 + f 3 p 3 ] 

Esto revela la similitud con la curva de Bézier. Excepto por el factor 1/6 al frente, los térmi¬ 
nos po y p 3 son iguales. La componente p 3 se ha incrementado por — 3t + 4, y la componente 
p 2 se incrementó por 3t + 1. Esas componentes hacen más cercana la curva a p , p 0 que la 
curva de Bézier. El factor 1 /6 es necesario para mantener la suma de los coeficientes igual 
a 1. La figura 10 compara una B-spline con una curva de Bézier que tiene los mismos puntos 
de control. 



FIGURA 10 Un segmento B-spline y una curva de Bézier. 


1. Demuestre que la B-spline no inicia en po, pero x(0) está en conv ¡po, pi, p 2 ¡. Suponien¬ 
do que po, Pi y P2 son afínmente independientes, encuentre las coordenadas afines de 
x(0) con respecto a {po, pi, P2}- 

2. Demuestre que la B-spline no termina en p 3 , pero x(l) está en conv {p¡, p 2 , p 3 }. Supo¬ 

niendo que p 1; P 2 y p 3 son afínmente independientes, encuentre las coordenadas afines 

de x(l) con respecto a {p 3 , p 2 , p 3 ). 


8.6 EJERCICIOS 

1. Suponga que una curva de Bézier se traslada a x(t) + b. Es decir, 
para 0 £ t £ 1, la nueva curva es 

x(í) = (1 -O 3 p 0 + 3í(l - í) 2 Pi 

+ 3í 2 (1 - t) p 2 + t 3 p 3 + b 

Demuestre que esta nueva curva es una vez más una curva 
de Bézier. [Sugerencia: ¿Dónde están los nuevos puntos de 
control?] 

2. La forma vectorial paramétrica de una curva B-spline se definió 
en los problemas de práctica como 

x (0 = ¿[(1 - 0 3 Po + (3í (1 - t) -3 1 + 4)p, 

+ (3f 2 (l — t) + 3t + l)p 2 + í 3 p 3 ] para 0 < t < 1, 

donde po, p¡, p 2 y P 3 son los puntos de control. 


a) Demuestre que para 0 S t í 1, x(f) está en la envolvente 
convexa de los puntos de control. 

tí) Suponga que una curva B-spline x(t) se traslada a x(f) + b 
(como en el ejercicio 1). Demuestre que esta nueva curva es 
una vez más una B-spline. 

3. Sea x(t) una curva de Bézier cúbica determinada por los puntos 

Po, Pl, P 2 y P3 

a) Calcule el vector tangente x'(t). Determine cómo x'(0) y 
x'(l) se relacionan con los puntos de control, y realice des¬ 
cripciones geométricas de las direcciones de esos vectores 
tangentes. ¿Es posible tener x'(l) = 0? 

tí) Calcule la segunda derivada x"(f) y determine cómo x"(0) 
y x"(l) se relacionan con los puntos de control. Dibuje un 
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esquema basado en la figura 10 y construya un segmento 
de recta que apunte en la dirección de x"(0). [Sugerencia: 
Utilice pi como el origen del sistema de coordenadas], 

4. Sea x(í) la B-spline del ejercicio 2, con puntos de control po, pi, 
P 2 y P 3 - 

a) Calcule el vector tangente x'(t) y determine cómo las deri¬ 
vadas x'( 0 ) y x'(l) se relacionan con los puntos de control. 
Realice descripciones geométricas de las direcciones de esos 
vectores tangentes. Explore qué pasa cuando x'(0) y x'(l) 
son iguales a 0. Justifique sus afirmaciones. 

tí) Calcule la segunda derivada x"(f) y encuentre cómo x"(0) 
y x"(l) se relacionan con los puntos de control. Dibuje un 
esquema basado en la figura 10 , y construya un segmento 
de recta que apunte en la dirección de x"(l). [Sugerencia: 
Utilice P 2 como el origen del sistema de coordenadas], 

5. Sean x(t) y y (t) curvas de Bézier cúbicas con puntos de control 
{po, pi, P 2 , P 3 } y {p 3 , P 4 , P 5 , Pó), respectivamente, de manera 
que x(t) y y (t) se unen en P 3 . Las siguientes preguntas se refie¬ 
ren a la curva que consiste en x(t) seguida de y(f). Para simplifi¬ 
car, suponga que la curva está en IR 2 . 

a) ¿Qué condición sobre los puntos de control garantizará 
que la curva tenga continuidad C 1 en P 3 ? Justifique su 
respuesta. 

tí) ¿Qué ocurre cuando x'(l) y y'(0) son ambos el vector 
cero? 

6 . Una B-spline se construye mediante segmentos B-spline, des¬ 
critos en el ejercicio 2. Sean po,..., Pr puntos de control. Para 
OSíSl, sean x(t) y y(f) determinadas por las matrices de geo¬ 
metría [po pi P 2 P 3 ] y [pi P 2 P 3 P 4 ], respectivamente. Observe 
cómo los dos segmentos comparten tres puntos de control. No 
hay traslape entre los dos segmentos, sin embargo, se unen en 
un punto extremo común, cercano a P 2 . 

a) Demuestre que la curva combinada tiene continuidad G°, es 
decir, x(l) = y(0). 

tí) Demuestre que la curva tiene continuidad C 1 en el punto de 
unión, x(l). Es decir, demuestre que x'(l) = y'(0). 

7. Sean x(t) y y(f) las curvas de Bézier del ejercicio 5, y supon¬ 
ga que la curva combinada tiene continuidad C 2 (que incluye 
la continuidad C 1 ) en P 3 . Sea x"(l) = y"(0) y pruebe que P 5 
está completamente determinado por pi, P 2 y P 3 . Así, los pun¬ 
tos po,..., P 3 y la condición C 2 determinan todos, excepto uno, 
los puntos de control para y (t). 

8. Sean x(t) y y(f) segmentos de una B-spline como en el ejerci¬ 
cio 6. Demuestre que la curva tiene continuidad C 2 (como tam¬ 
bién continuidad C 1 ) en x(l). Es decir, demuestre que x"(l) = 
y"(0). Esta continuidad de alto orden es deseable en aplicacio¬ 
nes CAD, como en el diseño de carrocerías de automóviles, 
porque las curvas y superficies aparecen mucho más lisas. Sin 
embargo, las B-splines requieren tres veces más cálculos que 
las curvas de Bézier, para curvas de longitud comparable. Para 
superficies, las B-splines necesitan nueve veces el cálculo de 
las superficies de Bézier. Con frecuencia, los programadores 
eligen superficies de Bézier en las aplicaciones (como en los 
simuladores de vuelo) que requieren generación en tiempo 
real. 


9. Una curva de Bézier cuártica se determina mediante cinco pun¬ 
tos de control, p 0 , pi, P 2 , P 3 y P 4 : 

x(t) = (1 - r) 4 p 0 + 4/(1 - r) 3 pj + 6í 2 (1 - r) 2 p 2 

+ 4r 3 (l — r)p 3 + r 4 p 4 for 0 < 7 < 1 

Construya la matriz base cuártica M B para x(í). 

10. La “B” en B-spline se refiere al hecho de que un segmento x(í) 
se puede escribir en términos de una matriz base, M$, en una 
forma similar a una curva de Bézier. Es decir, 

x(t) = GM s u(t) para 0 < í < 1 

donde G es la matriz de geometría [po pi P 2 P 3 ] y u(í) es 
el vector columna (1, t , t 2 , f 3 ). En una B-spline uniforme, cada 
segmento utiliza la misma matriz base, pero cambia la matriz 
de geometría. Construya la matriz base M s para x(t). 

En los ejercicios 11 y 12, marque cada enunciado como verdadero o 
falso. Justifique sus respuestas. 

11. a) La curva cúbica de Bézier está basada en cuatro puntos de 

control. 

b) Dada una curva de Bézier cuadrática x(t) con puntos de con¬ 
trol po, pi y P 2 , el segmento de recta dirigido pi — po (de po 
a pi) es el vector tangente a la curva en po- 

c) Cuando dos curvas de Bézier cuadráticas con puntos de con¬ 
trol ¡po, pi, P 2 ] y {p 2 , P 3 , P 4 } se unen en p 2 , la curva de 
Bézier combinada tendrá continuidad C 1 en P 2 si p 2 es el 
punto medio del segmento de recta entre Pi y P 3 . 

12. a) Las propiedades esenciales de la curvas de Bézier se pre¬ 

servan bajo la acción de transformaciones lineales, pero no 
traslaciones. 

b) Cuando dos curvas de Bézier x(f) y y(f) se unen en el pun¬ 
to donde x(l) = y(0), entonces la curva combinada tiene 
continuidad G° en ese punto. 

c) La matriz base de Bézier es una matriz cuyas columnas son 
los puntos de control de la curva. 

Los ejercicios 13 a 15 se refieren a la subdivisión de la curva de 
Bézier que se muestra en la figura 7. Sea x(t) la curva de Bézier, 
con puntos de control po,..., P 3 , y sean y (i) y z (t) las curvas de 
Bézier de subdivisión como en el libro, con puntos de control 
qo,..., q 3 y ro,..., r 3 , respectivamente. 

13. a) Utilice la ecuación (12) para demostrar que qi es el punto 

medio del segmento de po a pi. 

b) Aplique la ecuación (13) para demostrar que 

8q, = 8q 3 + p 0 + Pi - P 2 - P 3 

c) Utilice el inciso b), la ecuación (8) y el inciso a) para 
demostrar que q 2 es el punto medio del segmento de 
qi al punto medio del segmento de p! a p 2 . Es decir, 

q 2 = ¿tai + ¿(Pi + p 2 )]. 

14. a) Justifique cada signo de igualdad: 

3(r 3 -r 2 ) = z'(l) = .5x'(l) = |(p 3 -p 2 ) 
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b) Demuestre que r 2 es el punto medio del segmento de pi 
ap 3 . 

c) Justifique cada signo de igualdad: 3(ri — ro) = z'(0) = 

.5x'(.5). 

d) Utilice el inciso c) para demostrar que 8ri = —po — pi + 
P 2 + P3 + 8ro. 

e) Use el inciso d), la ecuación (8) y el inciso a ) para demostrar 
que ri es el punto medio del segmento de r 2 al punto medio 
del segmento de pi a p 2 . Es decir, r 3 = | [r 2 + ¿(Pi + p 2 )]• 

15. Algunas veces solo se necesita la mitad de una curva de Bézier 
para subdividir más. Por ejemplo, la subdivisión del lado “iz¬ 
quierdo” se logra con los incisos a) y c) del ejercicio 13 y la 
ecuación (8). Cuando se dividen ambas mitades de la curva x(í), 
es posible organizar los cálculos de manera eficiente para de¬ 
terminar al mismo tiempo los puntos de control izquierdos y 
derechos, sin emplear la ecuación (8) directamente. 

a) Demuestre que los vectores tangentes y'(l) y z'(0) son 
iguales. 

b) Utilice el inciso a) para demostrar que q 3 (que es igual a ro) 
es el punto medio del segmento de q 2 a r¡. 

c) Empleando el inciso b) y los resultados de los ejercicios 13 
y 14, escriba un algoritmo que calcule los puntos de control 
de y(f) y z (t) de manera eficiente. Solo se necesitan sumas y 
división entre 2. 

16. Explique por qué una curva cúbica de Bézier está determinada 
plenamente por x(0), x'(0), x(l) y x'(l). 


17. La simbología TrueType®, creada por Apple Computer y Ado¬ 
be Systems, utiliza curvas cuadráticas de Bézier, mientras que 
PostScript®, creado por Microsoft, emplea curvas cúbicas de 
Bézier. Las curvas cúbicas dan más flexibilidad para el diseño 
de los tipos de letra, pero es importante para Microsoft que cada 
letra que utiliza curvas cuadráticas se pueda transformar en una 
que use curvas cúbicas. Suponga que w(f) es una curva cuadrá¬ 
tica, con puntos de control po, pi y pi¬ 
al Encuentre puntos de control ro, U, r 2 y r 3 tales que la curva 

cúbica de Bézier x(f) con esos puntos de control y con la 
propiedad de que x(f) y w (t) tengan los mismos puntos ini¬ 
cial y terminal, así como los mismos vectores tangentes en 
t = 0 y t — 1. (Véase el ejercicio 16). 
b) Demuestre que si x(f) se construye como en el inciso a), en¬ 
tonces x(f) = w (t) para 0 Sí< 1. 

18. Utilice la multiplicación matricial particionada para calcular 
el siguiente producto matricial, que se presenta en la fórmula 
alternativa (5) para una curva de Bézier: 


O 

o 

o 


"Po" 

-3 3 0 0 


Pi 

3-630 


P 2 

-1 3-3 1 


_Ps_ 


SOLUCIONES A LOS PROBLEMAS DE PRÁCTICA 

1. De la ecuación (14) con t = 0, x(0) ¥= po porque 

x (0) = ¿[p 0 + 4 Pi + P 2 ] = ¿Po + fPi + ¿P2 

Los coeficientes son no negativos y suman 1, por lo que x(0) está en conv {po, pi, p 2 }, y 
las coordenadas afines con respecto a {po, Pi, p 2 } son (4, |, 

2. A partir de la ecuación (14) con t = 1, x(l) A p 3 porque 

x(l) = ¿[Pi + 4p 2 + p 3 ] = ¿p, + ¡p 2 + ip 3 

Los coeficientes son no negativos y suman 1, por lo que x( 1) está en conv ¡pi, p 2 , p 3 ), y las coor¬ 
denadas afines con respecto a ¡pi, p 2 , p 3 } son 
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Unicidad de la forma escalonada 
reducida 


Unicidad de la forma escalonada reducida 

Cada matriz A de m x n es equivalente por filas a una única matriz escalonada redu¬ 
cida U. 


DEMOSTRACIÓN La demostración se basa en la idea de la sección 4.3 de que las columnas 
de matrices equivalentes por filas tienen exactamente las mismas relaciones de dependencia 
lineal. 

El algoritmo de reducción por filas indica que al menos existe una matriz U del tipo 
mencionado. Suponga que A es equivalente por filas a las matrices U y V en forma escalonada 
reducida. La entrada del extremo izquierdo, distinta de cero, en una fila de U es un “1 prin¬ 
cipal'’. La ubicación de este 1 principal se conoce como posición pivote, y la columna corres¬ 
pondiente que lo contiene es una columna pivote. (Esta definición solo emplea la naturaleza 
escalonada de U y V, y no supone la unicidad de la forma escalonada reducida). 

Las columnas pivote de U y V son precisamente las columnas distintas de cero que no 
son linealmente dependientes de las columnas a su izquierda. (Esta condición se satisface 
automáticamente por una primera columna, si esta es distinta de cero). Como U y V son 
equivalentes por filas (ambas son equivalentes por filas a A), sus columnas tienen las mismas 
relaciones de dependencia lineal. Así, las columnas pivote de U y V se presentan en idénti¬ 
cas ubicaciones. Si existen r de tales columnas, y puesto que LJ y V están en forma escalonada 
reducida, entonces sus columnas pivote son las primeras r columnas de la matriz identidad de 
m x m. En consecuencia, son iguales las columnas pivote correspondientes de U y V. 

Por último, considere cualquier columna de U que no sea pivote, por ejemplo, la colum¬ 
na j. Esta columna es cero o una combinación lineal de las columnas pivote a su izquierda 
(porque esas columnas pivote son una base para el espacio generado por las columnas a la 
izquierda de la columna j). Ambos casos se pueden expresar mediante Ux = 0 para alguna 
x cuya j-ésima entrada es 1. Entonces, también Vx = 0, lo que significa que la columna j 
de V es cero o la misma combinación lineal de las columnas pivote de V a su izquierda. 
Como las columnas pivote correspondientes de U y V son iguales, entonces también son 
iguales las columnas j de U y V. Esto es válido para todas las columnas que no son pivote, 
de manera que V = U, lo que prueba la unicidad de U. 


Al 
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Números complejos 


Un número complejo es un número que se escribe en la forma 

Z = a + bi 

donde ay b son números reales, e / es un símbolo formal que satisface la relación i 2 = — 1. 
El número a es la parte real de z, que se denota como Re z, y b es la parte imaginaria de z, 
que se denota como Im z. Dos números complejos se consideran iguales si y solo si sus partes 
real e imaginaria son iguales. Por ejemplo, si z = 5 + (—2)¿, entonces Re z = 5 e Im z = —2. 
Para simplificar, se escribe 4 = 5 — 2 i. 

Un número real a se considera como un tipo especial de número complejo, al identifi¬ 
car a con a + Oí. Además, las operaciones aritméticas de los números reales se pueden exten¬ 
der al conjunto de números complejos. 

El sistema de números complejos, que se denota con C, es el conjunto de todos los nú¬ 
meros complejos, junto con las siguientes operaciones de suma y multiplicación: 


(1) 
( 2 ) 

Esas reglas se reducen a la suma y multiplicación ordinarias de números reales cuando 
b y d son cero en las ecuaciones (1) y (2). Es fácil comprobar que las leyes usuales de la 
aritmética para IR también son válidas para C. Por esta razón, la multiplicación por lo general 
se calcula mediante desarrollos algebraicos, como se muestra en el siguiente ejemplo. 

EJEMPLO 1 


(a + bi) + (c + di) = (a + c) + (b + d)i 
(a + bi)(c + di) = (ac — bd) + (ad + bc)i 


(5 - 20(3 + 4 i) = 15 + 20 i - 6 i - 8 i 2 
= 15+ 14/ — 8(—1) 

= 23 + 14/ 

Es decir, multiplique cada término de 5 — 2 i por cada término de 3 + 4/, utilice ¿ 2 = — 1, 
y escriba el resultado en la forma a + bi. ■ 

La resta de los números complejos z\ y Zi se define por 


zi - Z2 = zi + ( 1)Z2 


En particular, se escribe — z en vez de (— 1 )z. 
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El conjugado de z = a + bi es el número complejo z (que se lee “z barra”), definido 
por 



Para obtener z de z basta con cambiar el signo de la parte imaginaria. 


EJEMPLO 2 El conjugado de —3 + 4 i es —3 — 4i; escriba —3 + 4 i = — 3 — 4 i. 


Observe que si z = a + bi, entonces, 


zz = (a + bi){a — bi) = a 2 — abi + bai — b 2 i 2 = a 2 + b 2 (3) 


Como zz es real y no negativo, entonces tiene una raíz cuadrada real. El valor absoluto 
(o módulo) de z es el número real |z| definido por 


|z| = -¡zz = V a 2 + b 2 


Si z es un número real, entonces z = a + Oí, y |z| = Ja 2 , que es igual al valor absoluto ordi¬ 
nario de a. 

A continuación se listan algunas propiedades útiles de conjugados y del valor absoluto; 
w y z denotan números complejos. 

1 . z = z si y solo si z es un número real. 

2. w + z = w + z ■ 

3. Wz. = w z ; en particular, 7z = rz si r es un número real. 

4. zz = |z| 2 > 0. 

5. |iuz| = |ut||z|. 

6. \w + z\ < M + |z|. 

Si z A 0, entonces |z| > 0 y z tiene un inverso multiplicativo, que se denota como 1 /z 
o z _ 1 y está dado por 



Desde luego, un cociente w/z simplemente significa w ■ (1/z). 


EJEMPLO 3 Sean w = 3 + 4/ y z = 5 — 2 i. Calcule zz, |z| y w/z. 

SOLUCIÓN A partir de la ecuación (3), 

zz = 5 2 + (—2) 2 = 25 + 4 = 29 

Para el valor absoluto, |z| = */zf. = V29- Para calcular w/z, primero multiplique el nu¬ 
merador y el denominador por z, el conjugado del denominador. Utilizando la ecuación (3), 
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se elimina la / en el denominador: 

3 + 4 / 

5-2/ 

3 —4 i 5 + 2/ 

5 — 2 / 5 + 2 / 

15 + 6/ + 20/ — 8 
5 2 + (-2)2 

7 + 26/ 

29 

7 26. 

— + — / 

29 29 


Interpretación geométrica 

Cada número complejo z = o + bi corresponde a un punto (a, h) en el plano IR 2 , como en 
la figura 1. El eje horizontal es el eje real ya que los puntos (a, 0) en este corresponden 
a los números reales. El eje vertical es el eje imaginario porque los puntos (0, b) sobre 
este corresponden a los números imaginarios puros de la forma 0 + bi , o simplemente bi. 
El conjugado de z es la imagen de espejo de ¿ en el eje real. El valor absoluto de z es la 
distancia de (a, b) al origen. 

Eje 

imaginario 


Eje real 


lz = a-bi 

FIGURA 1 El complejo conjugado es una imagen 
de espejo. 


La suma de los números complejos z = a + biyw = c + di corresponde a la suma 
vectorial de (a, b) y (c, d ) en R 2 , como se muestra en la figura 2. 


Im z 


Re z 


FIGURA 2 Suma de números complejos. 




W 

Z 





APÉNDICE B Números complejos A5 

Para dar una representación gráfica de la multiplicación compleja, se utilizan coordena¬ 
das polares en IR 2 . Dado un número complejo diferente de cero z = ci + bi , sea cp el ángulo 
entre el eje real positivo y el punto (a, b), como se muestra en la figura 3, donde — tt < cp < 7r. 
El ángulo cp se llama el argumento de z:, y se escribe cp = arg z. De trigonometría, 

a = |z| eos cp, b = |z| sen cp 

y así, 

z = a + bi = |z|(cos cp + i sen cp) 


z 

Izl sen <p 

-Re z 

FIGURA 3 Coordenadas polares de z. 

Si w es otro número complejo distinto de cero, por ejemplo, 

w = |w| (eos íf + i sen #) 

entonces, empleando identidades trigonométricas estándares para el seno y coseno de la suma 
de dos ángulos, es posible comprobar que 

wz = |w| |z| [cos(tf + cp) + i sen(# + cp)] (4) 

Véase la figura 4. Para cocientes, se puede escribir una fórmula similar en forma polar. 
Las expresiones para productos y cocientes se enuncian como sigue. 

Im Z 


Rez 

FIGURA 4 Multiplicación con coordenadas 
polares. 

El producto de dos números complejos distintos de cero está dado, en forma polar, por 
el producto de sus valores absolutos y la suma de sus argumentos. El cociente de dos 
números complejos distintos de cero está dado por el cociente de sus valores absolu¬ 
tos y la diferencia de sus argumentos. 

Im z 

EJEMPLO 4 

a) Si w tiene valor absoluto 1, entonces w = eos í) + i sen i?, donde íi es el argumento 
de w. La multiplicación de cualquier número z diferente de cero por w simplemente hace 
girar a z un ángulo í). 

b) El argumento de i es 7r/2 radianes, de manera que la multiplicación de z por i hace girar 

a z un ángulo de 77/2 radianes. Por ejemplo, 3 + i gira (3 + i)i = — 1 + 3t. ■ 
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Potencias de un número complejo 

La fórmula (4) se aplica cuando z = w = r(cos i p 4- i sen i p). En este caso, 

Z 2 = r 2 (eos 2<p + i sen 2 cp) 

y 


= r(cos cp + i sen cp) ■ r \eos 2 cp + i sen 2 <p) 

= r 3 (cos 3 cp + i sen 3tp) 

En general, para cualquier entero positivo k, 

Z k = r k (eos kp> + i sen k<p) 

Este resultado se conoce como teorema de De Moivre. 

Números complejos y U 2 

No obstante que los elementos de [R 2 y C están en correspondencia uno a uno, y las ope¬ 
raciones de suma son esencialmente las mismas, existe una diferencia lógica entre R 2 y C. 
En R 2 solo se puede multiplicar un vector por un escalar real, mientras que en C es posi¬ 
ble multiplicar dos números complejos cualesquiera para obtener un tercer número comple¬ 
jo. (El producto punto en R 2 no cuenta, porque produce un escalar, no un elemento de R 2 .) 
Se utiliza notación escalar para los elementos de C con la finalidad de poner de relieve esta 
diferencia. 



El plano real R 2 . 


El plano complejo C. 



Glosario 


A 

adjunta clásica: La matriz adj A formada de una matriz cuadrada A 
al remplazar la entrada (i,j) de A por el cofactor (i,y), para toda 
i y y, y después transponer la matriz resultante. 

algoritmo de reducción por filas: Un método sistemático que em¬ 
plea operaciones elementales de fila que reduce una matriz a la 
forma escalonada o a la forma escalonada reducida. 

análisis de tendencia: El uso de polinomios ortogonales para ajustar 
datos, con el producto interior dado por la evaluación en un 
conjunto finito de puntos. 

ángulo (entre vectores diferentes de cero u y v en R 2 o R 3 ): El ángu¬ 
lo i? entre los dos segmentos de recta dirigidos del origen a los 
puntos u y v. Relaciona al producto escalar mediante 

u-v = ||u|| IMI eos & 

aproximación de Fourier (de orden n): El punto más cercano, en 
el subespacio de polinomios trigonométricos de n-ésimo orden, 
a una función dada en C[0, 2ir]. 

aritmética de punto flotante: Aritmética con números representa¬ 
dos como decimales ± ,d\ ■■■ d p x 10', donde r es un entero y 
el número p de dígitos a la derecha del punto decimal general¬ 
mente está entre 8 y 16. 

atractor (de un sistema dinámico en R 2 ): El origen cuando todas las 
trayectorias tienden a 0. 

B 

base (para un subespacio no trivial H de un espacio vectorial V ): 
Un conjunto indexado B = {vi,..., v^} en V tal que: i. B es un 
conjunto linealmente independiente y ii. El subespacio gene¬ 
rado por B coincide con H, es decir. H = Gen {vi,.v p }. 

base de vectores propios: Una base que consiste totalmente en 
vectores propios de una matriz dada. 

base estándar: La base £ = {ei,..., e„} para R" que consiste en las 
columnas de la matriz identidad de n x n, o la base {1 
para P„. 

base ortogonal: Una base que también es un conjunto ortogonal. 

base ortonormal: Una base que es un conjunto ortogonal de vec¬ 
tores unitarios. 

B-coordenadas de x: Véase coordenadas de x respecto de la base 
B. 

B-matriz (para T ): Una matriz |T |g para una transformación lineal 
T : V —» V respecto de una base B para V, con la propiedad de 
que |T(x)]g = [L]g [x]g para toda x en V. 

bola abierta B(p, S ) en R": El conjunto {x : ||x — p|| < 5) en R", 
donde S > 0. 

bola cerrada (en R"): Un conjunto {x : ||x — p|| < S} en R", donde 
p está en R” y S > 0. 


c 

cadena de Markov: Una secuencia de vectores de probabilidad xo, 
xi, X2,..., junto con una matriz estocástica P tal que Xj + i = Px¿ 
para k = 0 , 1 , 2 ,... 

cambio de base: Véase matriz de cambio de coordenadas, 
cambio relativo o error relativo (en b): La cantidad ||Ab||/||b|| 
cuando b se cambia a b + Ab. 

cociente de Rayleigh: R(x) = (x T Ax)/(x T x). Una estimación de un 
valor propio de A (por lo general, una matriz simétrica), 
codominio (de una transformación T : R" —» R"'): El conjunto R™ 
que contiene al rango de T. En general, si T mapea un espa¬ 
cio vectorial V en un espacio vectorial W, entonces W es el 
codominio de T. 

coeficientes de Fourier: Los pesos empleados para hacer que un 
polinomio trigonométrico sea una aproximación de Fourier 
a una función. 

coeficientes de regresión: Los coeficientes /3o y /3 1 en la recta de 
mínimos cuadrados y — ¡3 o + Pix. 
cofactor: Un número C¡¡ = (—1)' + ^ det Ay, llamado el cofactor (i,y) 
de A, donde Ay es la submatriz formada al eliminar la z-ésima 
fila y lay-ésima columna de A. 
cofactores: Véase desarrollo por cofactores. 
columna pivote: Una columna que contiene una posición pivote, 
combinación afín: Una combinación lineal de vectores (puntos en 
R”) en la que la suma de los pesos implicados es 1. 
combinación convexa (de puntos vi,..., v¿ en R"): Una combinación 
lineal de vectores (puntos) en la que los pesos en la combina¬ 
ción son positivos y la suma de los pesos es 1. 

combinación lineal: Una suma de múltiplos escalares de vectores. 
Los escalares se llaman pesos. 

combinación positiva (de puntos Vi,..., v,„ en R"): Una combinación 
lineal civi + ••• + c m \ m , donde toda c¡ a 0. 
complemento de Schur: Una cierta matriz formada a partir de 
los bloques de una matriz particionada de 2 x 2, A = [Ay]. 
Si An es invertible, su complemento de Schur está dado por 
A 2 2 — A 2 i Ajj 1 Ai 2 . Si A 22 es invertible, su complemento de 
Schur está dado por A n — A l2 A^, 1 A 2 \. 

complemento ortogonal (de W): El conjunto W de todos los 
vectores ortogonales a W. 

y-u 

componente de y ortogonal a u (para u + 0): El vector y - u. 

u-u 

componentes principales (de los datos en una matriz B de observa¬ 
ciones): Los vectores propios unitarios de una matriz de covarianza 
muestral S para B, con los vectores propios arreglados de tal 
manera que los valores propios correspondientes de S disminuyan 
en magnitud. Si B es una forma de desviación media, entonces las 
componentes principales son los vectores singulares derechos en 
una descomposición en valores singulares de B 1 . 


A7 
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composición de transformaciones lineales: Un mapeo generado 
al aplicar dos o más transformaciones lineales sucesivas. Si las 
transformaciones son transformaciones matriciales, por ejem¬ 
plo, multiplicación por la izquierda de B seguida por multipli¬ 
cación por la izquierda de A, entonces la composición es el 
mapeo x i-> A(Bx). 

conjunto abierto 5 en IR": Un conjunto que no contiene a ninguno 
de sus puntos frontera. (De manera equivalente, S es abierto si 
cada punto de S es un punto interior), 
conjunto acotado en IR": Un conjunto que está contenido en una 
bola abierta 6(0, S) para alguna S > 0. 
conjunto afín (o subconjunto afín): Un conjunto S de puntos 
tales que si p y q están en S, entonces, (1 — t)p + tq e 5 para 
cada número real t. 

conjunto afínmente dependiente: Un conjunto ¡vi,..., v ; ,j en IR" 
tal que existen números reales ci,..., c p , no todos cero, tales 
que ci + ■ • • + c p = 0 y cqvi + • • • + c p \ p = 0. 
conjunto afínmente independiente: Un conjunto ¡Vi,..., \ p ] en 
IR" que no tiene dependencia afín. 

conjunto cerrado (en IR"): Un conjunto que contiene todos sus 
puntos frontera. 

conjunto compacto (en IR"): Un conjunto en IR" que es cerrado y 
acotado. 

conjunto convexo: Un conjunto S con la propiedad de que para cada 
p y q en S, el segmento de recta pq está contenido en S. 
conjunto fundamental de soluciones: Una base para el conjunto 
de todas las soluciones de una ecuación diferencial o de una 
ecuación en diferencias lineal homogénea, 
conjunto generado por {vi,..., v p }: El conjunto Gen ¡vi,..., \ p j . 
conjunto generador (para un subespacio H): Cualquier conjunto 
¡Vi,..., v p } en H tal que H = Gen {vi,..., \ p }. 
conjunto generador mínimo (para un subespacio H): Un conjunto 
B que genera a H y tiene la propiedad de que si uno de los 
elementos de B se elimina de B, entonces el nuevo conjunto 
no genera a H. 

conjunto linealmente independiente máximo (en V): Un conjunto 
linealmente independiente B en V tal que si un vector v, que 
está en V pero no en B, se agrega a B entonces el nuevo conjun¬ 
to es linealmente dependiente. 

conjunto nivel (o gradiente) de una funcional lineal / sobre IR": 

Un conjunto [/: d] = {x e IR" : /(x) = d j 
conjunto ortogonal: Un conjunto S de vectores tales que u-v = 0 
para cada par distinto u, v en S. 

conjunto ortonormal: Un conjunto ortogonal de vectores unitarios, 
conjunto solución: El conjunto de todas las posibles soluciones 
de un sistema lineal. El conjunto solución es vacío cuando el 
sistema lineal es inconsistente. 

contracción: Un mapeo x i-> rx para algún escalar r, con 
0£r<l. 

controlable (par de matrices): Un par de matrices (A, 6) donde A es 
de n x n, B tiene n filas, y 

rango [ B AB A 2 B ■■■ A n ~ l B] = n 

Relacionado con un modelo de espacio de estados de un sis¬ 
tema de control y la ecuación en diferencias x^+i = Ax¿ + Bu* 
(k = 0,1,...). 


convergente (secuencia de vectores): Una secuencia {x*} tal que 
las entradas en x* se pueden hacer tan cercanas como se quiera 
a las entradas de algún vector fijo para toda k suficientemente 
grande. 

coordenadas baricéntricas (de un punto p respecto de un con¬ 
junto S = {vi,..., v¿} afínmente independiente): El conjunto 
(único) de pesos ci,..., c* tales que p = nvi + ••■ + c¡¿Vk y 
c\+ ■■■ + Ck = 1. (Algunas veces también se llaman coorde¬ 
nadas afines de p respecto de S.) 

coordenadas de x respecto de la base B = {bi,..., b,,}: Los pesos 
ci,..., c„ en la ecuación x = cibi + •■• + c„b„. 

coordenadas homogéneas: En R\ la representación de (x, y, z) 
como ( X , L Z, H) para cualquier H + 0, donde x = X/H, 
y = Y/H, y z — Z/H. En IR 2 , generalmente se toma H = 1, y las 
coordenadas homogéneas de (x, y) se escriben como (x, y, 1). 

corriente de circuito: La cantidad de corriente eléctrica que fluye 
por un circuito que hace la suma algebraica de las caídas de 
voltaje Rl, alrededor del circuito, sea igual a la suma algebraica 
de las fuentes de voltaje en el circuito. 

covarianza (de variables x¡ y x¡, para i A j): La entrada s¡¡ en la matriz 
de covarianza S para una matriz de observaciones, donde x¡ y x¡ 
varían sobre las coordenadas i-ésima yy'-ésima, respectivamente, 
de los vectores de observaciones. 

cubo: Un objeto sólido tridimensional acotado por seis caras cua¬ 
dradas, con tres caras que se encuentran en cada vértice. 

curva de Bézier cuadrática: Una curva cuya descripción se 
puede describir en la forma g(f) = (1 — í)fo(í) + rfj(í) para 
0 < í < 1. donde f 0 (í) = (1 — t) p 0 + fpi y fflf) = (1 - 
t)pi + fl> 2 - Los puntos po, pi, P 2 son los puntos de control 
para la curva. 

D 

demandas intermedias: Demandas de bienes o servicios que se 
consumirán en el proceso de elaborar otros bienes y servicios 
para los consumidores. Si x es el nivel de producción y C 
es la matriz de consumo, entonces Cx lista las demandas 
intermedias. 

desarrollo columna-fila: La expresión de un producto AB como una 
suma de productos exteriores: colflA) filai(B)+ + col„(A) 
fila„(B), donde n es el número de columnas de A. 

desarrollo por cofactores: Una fórmula para det A empleando los 
cofactores asociados con una fila o una columna, por ejemplo, 
para la fila 1: 

det A = «nCn + + ü\ n C\ n 

descomposición de vectores propios (de x): Una ecuación, 
x = ciVi + ■•• + c n x n , que expresa a x como una combi¬ 
nación lineal de vectores propios de una matriz. 

descomposición en valores singulares (de una matriz A de m x «): 
A = UI,V T , donde U es una matriz ortogonal de m x m, V es 
una matriz ortogonal de n x n, y I es una matriz de m x n con 
entradas no negativas sobre la diagonal principal (arregladas en 
orden decreciente de magnitud) y ceros en las demás entra¬ 
das. Si rango A = r, entonces 2 tiene exactamente r entradas 
positivas (los valores singulares distintos de cero de A) sobre 
la diagonal. 
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descomposición en valores singulares reducida: Una factoriza- 
ción A = UDV T , para una matriz A de m x n, con rango r, donde 
U es de m x r con columnas ortonormales, D es una matriz 
diagonal de r x r con r valores singulares de A distintos de cero 
en su diagonal, y V es de n x r con columnas ortonormales. 
descomposición espectral (de A): Una representación 

A = Aiuiu[ + • • • + A„u„u|' 

donde {ui,...,u„} es una base ortonormal de vectores propios de 
A, y Ai,..., A„ son los valores propios correspondientes de A. 

descomposición ortogonal: La representación de un vector y 
como la suma de dos vectores, uno en un subespacio W 
especificado y el otro en VEA En general, una descomposición 
y =CiUi + ■•■ + CpU p , donde {m,..., u p ¡ es una base ortogonal 
para un subespacio que contiene a y. 

descomposición polar (de A): Una factorización A = PQ, donde 
P es una matriz positiva semidefinida den x n con el mismo 
rango que A, y Q es una matriz ortogonal de n x n. 
descripción explícita (de un subespacio W de R"): Una representa¬ 
ción paramétrica de W como el conjunto de todas las combi¬ 
naciones lineales de un conjunto de vectores específicos, 
descripción implícita (de un subespacio W de R"): Un conjunto de 
una o más ecuaciones homogéneas que caracterizan a los pun¬ 
tos de W. 

desigualdad de Cauchy-Schwarz: |(u, v)| £ ||w|| j|v|| para toda u, v. 
desigualdad del triángulo: ||u + v|| £ ||u|| + ||v|| para toda u, v. 
determinante (de una matriz cuadrada A): El número det A defini¬ 
do inductivamente mediante un desarrollo por cofactores sobre 
la primera fila de A. Además, (—1)' veces el producto de las 
entradas diagonales en cualquier forma escalonada U obtenida 
de A por remplazos de fila y r intercambios de fila (pero no por 
operaciones de escalamiento). 

diagonal por bloques (matriz): Una matriz particionada A = [A, ; ] 
tal que cada bloque A¡¡ es una matriz cero para i A j. 

diagonal principal (de una matriz): Las entradas con igual índice 
de fila y columna. 

diferente de cero (matriz o vector): Una matriz (con posiblemente 
solo una fila o columna) que contiene al menos una entrada 
distinta de cero. 

dilatación: Un mapeo x^rx para algún escalar r, con 1 <r. 

dimensión: 

de un conjunto S\ La dimensión del plano afín más pequeño 
que contiene a S. 

de un espacio vectorial V: El número de vectores en una base 
para V, que se escribe como dim V. La dimensión del espa¬ 
cio cero es 0. 

de un plano afín S: La dimensión del subespacio paralelo 
correspondiente. 

de un subespacio S: El número de vectores en una base para S, 
que se escribe como dim S. 

distancia a un subespacio: La distancia de un punto dado (vector) v 
al punto más cercano en el subespacio, 
distancia entre u y v: La longitud del vector u — v, que se denota 
como dist (u, v). 

dominio (de una transformación T): El conjunto de todos los vec¬ 
tores x para los cuales T(x) está definido. 


E 

ecuación auxiliar: Una ecuación polinomial en una variable r, 
creada con los coeficientes de una ecuación en diferencias 
homogénea. 

ecuación característica (de A): det(A - A/) = 0. 

ecuación en diferencias (o relación de recurrencia lineal): Una 

ecuación de la forma xhi = Ax* (k — 0, 1, 2,...) cuya solu¬ 
ción es una secuencia de vectores, xo, Xi,... 

ecuación homogénea: Una ecuación de la forma Ax = 0, posible¬ 
mente escrita como una ecuación vectorial o como un sistema 
de ecuaciones lineales. 

ecuación lineal (en las variables jci,..., x n ): Una ecuación que se 
puede escribir en la forma a¡x¡ + 02 X 2 + ••• + a„x„ = b, donde 
b y los coeficientes ai,..., a n son números reales o complejos. 

ecuación matricial: Una ecuación que implica al menos una matriz; 
por ejemplo. Ax = b. 

ecuación no homogénea: Una ecuación de la forma Ax = b con 
b A 0, posiblemente escrita como una ecuación vectorial o 
como un sistema de ecuaciones lineales. 

ecuación paramétrica de un plano: Una ecuación de la forma 
x = p + su + fv ( s , t en R), con u y v linealmente 
independientes. 

ecuación paramétrica de una recta: Una ecuación de la forma 
x = p + rv (t en R). 

ecuación vectorial: Una ecuación que implica una combinación 
lineal de vectores con pesos indeterminados. 

ecuaciones normales: El sistema de ecuaciones que se representa 
por A r Ax = A r b, cuya solución conduce a las soluciones de 
mínimos cuadrados de Ax = b. En estadística, una notación 
común es X T X[3 = X T y. 

ejes principales (de una forma cuadrática x T Ax): Las columnas 
ortonormales de una matriz ortogonal P tal que P~ l AP es dia¬ 
gonal. (Esas columnas son vectores propios unitarios de A.) 
Por lo general, las columnas de P se ordenan de tal manera 
que los valores propios correspondientes de A se acomodan 
en orden decreciente de magnitud. 

eliminación gaussiana: Véase algoritmo de reducción por filas. 

entrada principal: La entrada distinta de cero en el extremo iz¬ 
quierdo en una fila de una matriz. 

entradas diagonales (en una matriz): Entradas con iguales índices 
de fila y columna. 

envolvente afín (o afín generado) de un conjunto S: El conjunto 
de todas las combinaciones afines de puntos en 5, que se denota 
como aff S. 

envolvente convexa (de un conjunto S): El conjunto de todas las 
combinaciones convexas de puntos en S, que se denota como: 
conv S. 

envolvente positiva (de un conjunto S): El conjunto de todas las 
combinaciones positivas de puntos en S, que se denota como 
pos S. 

error cuadrático medio: El error de una aproximación en un espa¬ 
cio con producto interior, donde el producto interior está dado 
por una integral definida. 
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error de mínimos cuadrados: La distancia ||b — Ax|| de b a Ax, 
cuando x es una solución de mínimos cuadrados de Ax = b. 

error por redondeo: Error en la aritmética de punto flotante causa¬ 
do cuando el resultado de un cálculo se redondea (se trunca) 
al número de dígitos de punto flotante almacenado. Además, 
el error que resulta cuando la representación decimal de un 
número tal como 1/3 se aproxima por medio de un número de 
punto flotante con una cantidad finita de dígitos, 
escalamiento (de un vector): Operación que consiste en multipli¬ 
car un vector (o una fila o columna de una matriz) por un escalar 
distinto de cero. 

escalar: Un número (real) empleado para multiplicar un vector o 
una matriz. 

espacio columna (de una matriz A de m x n): El conjunto Col A 
de todas las combinaciones lineales de las columnas de A. 
Si A = [ai a„], entonces Col A = Gen {ai,..., a„}. De ma¬ 
nera equivalente. 

Col A = [y : y = Ax para alguna x en IR”} 

espacio con producto interior: Un espacio vectorial sobre el cual se 
define un producto interior. 

espacio fila (de una matriz A): El conjunto Fil A de todas las 
combinaciones lineales de los vectores formados con las filas 
de A; también se denota como Col A T . 
espacio nulo (de una matriz A de m x n): El conjunto Nul A de 
todas las soluciones de la ecuación homogénea Ax = 0. 
Nul A = {x : x está en R" y Ax = 0). 
espacio propio (de A correspondiente a A): El conjunto de todas las 
soluciones de Ax = Ax, donde A es un valor propio de A. Consiste 
en el vector cero y todos los vectores propios asociados a A. 
espacio vectorial: Un conjunto de objetos, llamados vectores, so¬ 
bre el cual están definidas dos operaciones, llamadas suma y 
multiplicación por escalares. Deben satisfacerse 10 axiomas. 
Véase la primera definición en la sección 4.1. 
espacio vectorial de dimensión finita: Un espacio vectorial que se 
genera por un conjunto finito de vectores, 
espacio vectorial de dimensión infinita: Un espacio vectorial V 
diferente de cero que no tiene base finita, 
espacios vectoriales isomorfos: Dos espacios vectoriales V y W 
para los cuales existe una transformación lineal T uno a uno 
que mapea V sobre W. 

F 

factorización (de A): Una ecuación que expresa A como un producto 
de dos o más matrices. 

factorización de Cholesky: Una factorización A = R T R, donde R 
es una matriz triangular superior invertible cuyas entradas dia¬ 
gonales son todas positivas. 

factorización de Schur (de A, para escalares reales): Una factori¬ 
zación A = URU T de una matriz A de n x n, que tiene n va¬ 
lor propios reales, donde U es una matriz ortogonal de n x n, y 
R es una matriz triangular superior. 

factorización LU: La representación de una matriz A en la forma 
A = LU donde L es una matriz triangular inferior cuadrada 
con unos sobre la diagonal (una matriz triangular inferior uni¬ 
taria) y U es una forma escalonada de A. 


factorización LU permutada: La representación de una matriz A 
en la forma A = LU donde L es una matriz cuadrada tal que 
una permutación de sus filas formará una matriz triangular in¬ 
ferior unitaria, y U es una forma escalonada de A. 

factorización QR: Una factorización de una matriz A de m x n con 
columnas linealmente independientes, A = QR, donde Q es una 
matriz de m x n cuyas columnas forman una base ortonormal 
para Col A, y Res una matriz invertible triangular superior de 
n x n con entradas positivas sobre su diagonal. 

fase progresiva (de reducción por filas): La primera parte del algo¬ 
ritmo que reduce una matriz a la forma escalonada. 

fase regresiva (de reducción por filas): La última parte del algorit¬ 
mo que reduce una matriz en forma escalonada a una forma 
escalonada reducida. 

filtro lineal: Una ecuación en diferencias lineal empleada para 
transformar señales discretas en el tiempo. 

flop: Una operación aritmética ( + . —, *, /) que se efectúa sobre 
dos números reales de punto flotante. 

forma cuadrática: Una función Q definida para x en IR” por 
<2(x) = x T Ax, donde A es una matriz simétrica de n x n (llama¬ 
da la matriz de la forma cuadrática). 

forma cuadrática indefinida: Una forma cuadrática Q tal que (Ax) 
toma valores positivos y negativos. 

forma cuadrática negativa definida: Una forma cuadrática Q tal 
que Q(x) < 0 para toda x 0. 

forma cuadrática negativa semidefinida: Una forma cuadrática 
Q tal que Q(x) £ 0 para toda x. 

forma cuadrática positiva definida: Una forma cuadrática Q tal 
que <2(x) > 0 para toda x í 0. 

forma cuadrática positiva semidefinida: Una forma cuadrática Q 
tal que Q(x) a 0 para toda x. 

forma de desviación media (de un vector): Un vector cuyas entra¬ 
das suman cero. 

forma de desviación media (de una matriz de observaciones): Una 
matriz cuyos vectores fila están en forma de desviación media. 
Para cada fila, las entradas suman cero. 

forma escalonada (o forma escalonada por filas de una matriz): 
Una matriz escalonada que es equivalente por filas a la matriz 
dada. 

forma escalonada reducida (o forma escalonada reducida por fi¬ 
las): Una matriz escalonada reducida que es equivalente por 
filas a una matriz dada. 

~ y 

forma homogénea de (un vector) v en IR”: El punto v = 

en ÍR" +1 . 

funcional lineal (en IR"): Una transformación lineal / de IR" a IR. 

funciones propias (de una ecuación diferencial x'(0 = Ax(t)): Una 
función x(f) = \e Xt , donde v es un vector propio de A, y A es 
el valor propio correspondiente. 

G 

Gen {vi,..., v p }: El conjunto de todas las combinaciones lineales 
de vi,.. ., x p . También, el subespacio generado por Vi,. .., x p . 
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H 

hiperplano (en IR"): Un plano afín en R" de dimensión n — 1. 
También: un traslado de un subespacio de dimensión n — 1. 

hiperplano de soporte (a un conjunto convexo compacto S en R"): 
Un hiperplano H = [/: d] tal que H n S A 0 y f(x) < d para 
toda x en S o f(x) a d para toda x en S. 

I 

Im x: El vector en R" formado con las partes imaginarias de las en¬ 
tradas de un vector x en C". 

imagen (de un vector x bajo una transformación T ): El vector T(x) 
asignado a x por T. 

inversa (de urna matriz A de n x ri)\ Urna matriz A -1 de n x n, tal 
que AA -1 = A -1 = /„. 

inversa de Moore-Penrose: Véase seudoinversa. 

inversa por la derecha (de A): Cualquier matriz rectangular C tal 
que AC — I. 

inversa por la izquierda (de A): Cualquier matriz rectangular C 
tal que CA = I. 

isomorfismo: Un mapeo lineal uno a uno de un espacio vectorial 
sobre otro. 

L 

ley asociativa de la multiplicación: A(fiC) = (Afi)C, para toda A, 
B, C. 

leyes de Kirchhoff: 1. (ley de voltaje) La suma algebraica de las 
caídas de voltaje R1 en una dirección alrededor de un circuito 
es igual a la suma algebraica de las fuentes de voltaje en la 
misma dirección alrededor del circuito. 2. (ley de corriente) La 
corriente en una rama es la suma algebraica de las corrientes de 
circuito que fluyen por esa rama. 

leyes distributivas: (izquierda) A(B + C)= AB + AC, y (derecha) 
(B + C)A = BA + CA, para toda A, B, C. 

linealmente dependientes (vectores): Un conjunto indexado 
{vi,,.., v p } con la propiedad de que existen pesos ci,..., c p , 
no todos cero, tales que cqvi + •■• + c p \ p =0. Es decir, la 
ecuación vectorial civi + C 2 V 2 + ••• + c p v p = 0 tiene una so¬ 
lución no trivial. 

longitud (o norma, de v): El escalar ||v|| = ^/vv = y/{v, v). 

M 

magnitud (de un vector): Véase norma. 

mapeo: Véase transformación. 

mapeo de coordenadas (determinado por una base ordenada B en 
un espacio vectorial V): Un mapeo que a cada x en V le asocia 
su vector coordenado [x]g. 

mapeo sobre: Un mapeo T : R" — > R m tal que cada b en R"' es la 
imagen de al menos una x en R". 

mapeo uno a uno: Un mapeo T : R" — > R"' tal que cada b en R" ! es 
la imagen de a lo sumo una x en R". 

matrices conformadas para multiplicación por bloques: Dos 
matrices particionadas Ay B tales que el producto por bloques 
AB está definido: la partición columna de A debe ajustar con la 
partición fila de B. 


matrices equivalentes por filas: Dos matrices para las cuales existe 
una secuencia (finita) de operaciones de fila que transforma una 
matriz en la otra. 

matrices que conmutan: Dos matrices Ay B tales que AB = BA. 

matrices semejantes: Matrices Ay B tales que P l AP = B, o bien, 
de manera equivalente, A = PBP' 1 , para alguna matriz inver¬ 
tible P. 

matriz: Un arreglo rectangular de números. 

matriz aumentada: Una matriz construida mediante una matriz de 
coeficientes para un sistema lineal y una o más columnas a la 
derecha. Cada columna adicional contiene las constantes del 
lado derecho de un sistema con la matriz de coeficientes dada. 

matriz banda: Una matriz cuyas entradas diferentes de cero están 
dentro de una banda a lo largo de la diagonal principal. 

matriz bidiagonal: Una matriz cuyas entradas diferentes de cero 
están sobre la diagonal principal y sobre una diagonal adyacente 
a la diagonal principal. 

matriz casi singular: Una matriz mal condicionada. 

matriz compañera: Una matriz de forma especial cuyo polinomio 
característico es (— l)"p(A) cuando p( A) es un polinomio espe¬ 
cificado cuyo término principal es A". 

matriz de cambio de coordenadas (de una base B a una base C): 
Una matriz C< £ B que transforma vectores de 6-coordenadas 
a vectores de C-coordenadas: [x]¿ = c ^_ B [x\¡¡. Si C es la base 
estándar para R", entonces algunas veces C JL B se escribe 
como P B . 

matriz de coeficientes: Una matriz cuyas entradas son los coeficien¬ 
tes de un sistema de ecuaciones lineales. 

matriz de consumo: Una matriz en el modelo de entrada y salida de 
Leontief cuyas columnas son los vectores de consumo unitarios 
para los diversos sectores de una economía. 

matriz de covarianza (o matriz de covarianza muestral): La 

matriz S de p x p definida por S ={N — 1)~ 1 BB T , donde B, es 
una matriz de observaciones de p x N en forma de desviación 
de la media. 

matriz de diseño: La matriz X en el modelo lineal y = X¿8 + e, 
donde las columnas de X están determinadas de alguna forma 
por los valores observados de ciertas variables independientes. 

matriz de entrada-salida: Véase matriz de consumo. 

matriz de flexibilidad: Una matriz cuya y-ésima columna da las 
deflexiones de una viga elástica en puntos específicos cuando se 
aplica una unidad de fuerza en el y-ésimo punto sobre la viga. 

matriz de Gram (de A): La matriz A'A. 

matriz de m x n. Una matriz con m filas y n columnas. 

matriz de migración: Una matriz que indica el movimiento 
porcentual entre dos lugares diferentes, de un periodo al 
siguiente. 

matriz de observaciones: Una matriz de p x N cuyas columnas 
son vectores de observaciones, cada columna lista p medicio¬ 
nes realizadas sobre un individuo u objeto en una población 
dada o en un conjunto. 

matriz de proyección (o matriz de proyección ortogonal): Una 

matriz simétrica B tal que B 2 = B. Un ejemplo sencillo es 
B = vv r , donde v es un vector unitario. 
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matriz de rango completo: Una matriz de m x n cuyo rango es el 
menor de m y n. 

matriz de rigidez: La inversa de una matriz de flexibilidad. La 
y-ésima columna de una matriz de rigidez da las cargas que se 
deben aplicar en puntos específicos sobre la viga elástica para 
producir una deflexión unitaria en el y-ésimo punto sobre la 
viga. 

matriz de transferencia: Una matriz A asociada con un circuito 
eléctrico que tiene terminales de entrada y salida, de tal manera 
que el vector de salida es igual a A por el vector de entrada. 

matriz de Vandermonde: Una matriz V de n x n o su transpuesta, 
cuando V tiene la forma 


1 

X¡ 

x\ • 

v«— 

1 

X 2 

X 2 

• • x n ~ 

1 

X„ 

X 2 

x n 

x n ~ 

x n 


matriz diagonal: Una matriz cuadrada cuyas entradas fuera de la 
diagonal principal son cero. 

matriz diagonalizable: Una matriz que se puede escribir en la for¬ 
ma factorizada PDP 1 , donde D es una matriz diagonal y P es 
una matriz invertible. 

matriz diagonalizable ortogonalmente: Una matriz A que admite 
una factorización, A = PDP 1 , con P una matriz ortogonal 
( P _1 = P T ) y D diagonal. 

matriz elemental: Una matriz invertible que resulta al efectuar una 
operación elemental de fila sobre una matriz identidad. 

matriz escalonada (o matriz escalonada por filas): Una matriz 
rectangular que tiene tres propiedades: 1. Todas las filas dis¬ 
tintas de cero están por arriba de cualquier fila constituida 
únicamente de ceros. 2. Cada entrada principal de una fila está 
en una columna a la derecha de la entrada principal de la fila 
superior. 3. En una columna, todas las entradas debajo de una 
entrada principal valen cero. 

matriz escalonada reducida: Una matriz rectangular en forma 
escalonada que tiene estas propiedades adicionales: la entrada 
principal en cada fila distinta de cero es 1, y cada uno de esos 
1 es la única entrada distinta de cero en su columna respectiva. 

matriz estándar (para una transformación lineal T ): La matriz A tal 
que T(x) = Ax para toda x en el dominio de T. 

matriz estocástica: Una matriz cuadrada cuyas columnas son vec¬ 
tores de probabilidad. 

matriz estocástica regular: Una matriz estocástica P tal que algu¬ 
na potencia matricial P k solo contiene entradas estrictamente 
positivas. 

matriz identidad (denotada por I o /„): Una matriz cuadrada con 
unos sobre la diagonal y ceros en las demás entradas. 

matriz indefinida: Una matriz simétrica A tal que x T Ax toma valores 
positivos y negativos. 

matriz invertible: Una matriz cuadrada que tiene una inversa. 

matriz mal condicionada: Una matriz cuadrada con un número de 
condición grande (o posiblemente infinito); una matriz que es 
singular o que puede convertirse en singular si alguna de sus 
entradas se modifica ligeramente. 


matriz negativa definida: Una matriz simétrica A tal que x T Ax < 0 
para toda x^O. 

matriz negativa semidefinida: Una matriz simétrica A tal que 
x^x £ 0 para toda x. 
matriz no singular: Una matriz invertible. 

matriz ortogonal: Una matriz cuadrada U invertible tal que 
u- 1 = U T . 

matriz para T respecto de las bases B y C: Una matriz M para 
una transformación lineal T : V —>W con la propiedad de que 
[T(x)]c = M[x]g para todas las x en V, donde B es una base 
para V, y C es una base para W. Cuando W = V y C — B, 
la matriz M se llama matriz B para T y se denota como [T]g. 
matriz particionada (o matriz por bloques): Una matriz cuyas 
entradas son en sí mismas matrices de tamaños adecuados, 
matriz por bloques: Véase matriz particionada. 
matriz positiva definida: Una matriz simétrica A tal que x T Ax > 0 
para toda x # 0. 

matriz positiva semidefinida: Una matriz simétrica A tal que 
x^x a 0 para toda x. 

matriz simétrica: Una matriz A tal que A T = A. 
matriz singular: Una matriz cuadrada que no tiene inversa, 
matriz triangular: Una matriz A con ceros arriba o debajo de las 
entradas diagonales. 

matriz triangular inferior: Una matriz con ceros arriba de la 
diagonal principal. 

matriz triangular inferior permutada: Una matriz tal que una 
permutación de sus filas formará una matriz triangular inferior, 
matriz triangular inferior unitaria: Una matriz triangular inferior 
cuadrada con unos sobre la diagonal principal, 
matriz triangular superior: Una matriz U (no necesariamente cua¬ 
drada) con ceros debajo de las entradas diagonales un, i< 22 ,--- 
media muestral: El promedio M de un conjunto de vectores, 
Zi„.., X N , dado por M = (l/N)(Xi + ■■■ + X N ). 
mejor aproximación: El punto más cercano (en un subespacio) a 
un vector dado. 

método de potencias: Un algoritmo para estimar un valor propio 
estrictamente dominante de una matriz cuadrada, 
método de potencias inverso: Un algoritmo para estimar un valor 
propio A de una matriz cuadrada, cuando está disponible una 
buena estimación inicial de A. 

mínimos cuadrados ponderados: Problemas de mínimos cuadrados 
con un producto interior ponderado tal como 

(x,y) = utjXiyi -1- w 2 n x„y„ 

misma dirección (como un vector v): Un vector que es un múltiplo 
positivo de v. 

modelo de entrada-salida: Véase modelo de entrada y salida de 
Leontief. 

modelo de intercambio: Véase modelo de intercambio de Leontief. 
modelo de intercambio (o cerrado) de Leontief: Un modelo de una 
economía donde están fijas las entradas y las salidas, y donde se 
busca un conjunto de precios para los productos de los sectores 
de tal forma que el ingreso de cada sector iguale los gastos. 
Esta condición de "equilibrio” se expresa como un sistema de 
ecuaciones lineales, con los precios como las incógnitas. 
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modelo de Leontief de entrada y salida (o ecuación de producción 
de Leontief): La ecuación x = Cx + d, donde x es la produc¬ 
ción, d es la demanda final, y C es la matriz de consumo (o 
entrada-salida). La j-ésima columna de C lista las entradas que 
el sector j consume por unidad de salida, 
modelo lineal (en estadística): Cualquier ecuación de la forma 
y = X/3 + e, donde X y y son conocidas, y ¿8 se elige para 
minimizar la longitud del vector residual, e. 
modelo matricial por etapas: Una ecuación en diferencias x¿. ( | = 
Axi¡, donde x* lista el número de hembras en una población en 
el tiempo k, con las hembras clasificadas por varias etapas de 
desarrollo (juveniles, subadultos y adultos). 

multiplicación matricial por bloques: La multiplicación fila-co¬ 
lumna de matrices particionadas como si las entradas en bloques 
fueran escalares. 

multiplicación por la derecha (por A ): Multiplicación de una matriz 
por la derecha por A. 

multiplicación por la izquierda (por A): Multiplicación por A de 
un vector o una matriz por la izquierda, 
multiplicidad algebraica: La multiplicidad de un valor propio como 
una raíz de la ecuación característica, 
múltiplo escalar de u por c: El vector cu que se obtiene al multipli¬ 
car cada entrada en u por c. 

N 

norma (o longitud, de v): El escalar ||v|| = ^/vv = y^v, v). 
normalización (de un vector v diferente de cero): El proceso de crear 
un vector unitario u que es un múltiplo positivo de v. 
núcleo (de una transformación lineal T : V —> W): El conjunto de x 
en V tal que T(x) = 0. 

número de condición (de A): El cociente cri/o-,,, donde ctí es el 
valor singular más grande de A y cr„ es el valor singular más 
pequeño. El número de condición es +°° cuando cr n es cero. 

O 

operaciones elementales de fila: 1. Remplazo de una fila por la 
suma de sí misma y un múltiplo de otra fila. 2. Intercambio de 
dos filas. 3. (Escalamiento) Multiplicación de todas las entradas 
en una fila por una constante distinta de cero. 

optimización restringida: El problema de maximizar una cantidad 
como x^x o ||Ax|| cuando x está sujeta a una o más restriccio¬ 
nes, tales como x r x = 1 o x r v = 0. 

origen: El vector cero. 

ortogonal a W: Ortogonal a cada vector en W. 

P 

parte triangular inferior (de A): Una matriz triangular inferior cuyas 
entradas sobre la diagonal principal y abajo de ella coinciden 
con las de A. 

perfil (de un conjunto S en IR"): El conjunto de puntos extremos de S. 
pesos: Los escalares que se emplean en una combinación lineal, 
pivote: Un número distinto de cero que se emplea en una posición 
pivote para crear ceros mediante operaciones de fila o se cambia 
en un 1 principal, el cual, a la vez, se utiliza para crear ceros. 


plano afín (en IR''): Un traslado de un subespacio de IR". 

plano que pasa por u, v y el origen: Un conjunto cuya ecuación 
paramétrica es x = ,vu + tx (s, t en R), con u y v linealmente 
independientes. 

planos afines paralelos: Dos o más planos afines tales que cada uno 
es un traslado de los otros planos afines. 

poliedro: Un polítopo en R 3 . 

polígono: Un polítopo en IR 2 . 

polinomio característico (de A): det(A — A/) o, en algunos libros, 
det(Ai - A). 

polinomio de interpolación: Un polinomio cuya gráfica pasa a tra¬ 
vés de cada punto en un conjunto de puntos de datos en IR 2 . 

polinomio trigonométrico: Una combinación lineal de la función 
constante 1 y funciones seno y coseno, como eos nt y sen nt. 

polítopo: La envolvente convexa de un conjunto finito de puntos en 
R" (un tipo especial de conjunto convexo compacto). 

posición estándar: La posición de la gráfica de una ecuación 
x T Ax = c, cuando A es una matriz diagonal. 

posición pivote: Una posición en una matriz A que corresponde a 
una entrada principal en cada forma escalonada de A. 

precios de equilibrio: Un conjunto de precios para la producción 
total de los diversos sectores en una economía, de tal manera 
que el ingreso de cada sector logre equilibrar sus gastos. 

pregunta de existencia: Pregunta: “¿Existe una solución al sistema?”. 
Es decir, “¿el sistema es consistente?”. Además, “¿existe solu¬ 
ción de Ax = b para todas las posibles b?”. 

pregunta de unicidad: Pregunta: “¿Si existe una solución de un 
sistema, esa solución es la única?”. 

problema de mínimos cuadrados general: A partir de una matriz 
A de m x n, y un vector b en R'", se encuentra x en R" tal que 
||b — Ax|| < ||b — Ax|| para toda x en R”. 

proceso de Gram-Schmidt: Un algoritmo para producir una base 
ortogonal u ortonormal para un subespacio que se genera por 
un conjunto dado de vectores. 

producto Ax: La combinación lineal de las columnas de A emplean¬ 
do como pesos las entradas correspondientes en x. 

producto cruzado: Un término cx¡Xj en una forma cuadrática, con 

i A j. 

producto exterior: Un producto matricial uv r donde u y v son 
vectores en R" vistos como matrices de n x 1. (El símbolo de 
transpuesta está sobre el "exterior” de los símbolos u y v). 

producto interior: El escalar u r v, generalmente escrito como 
u-v, donde u y v son vectores en R" vistos como matrices de 
n x 1. También se llama el producto punto de u y v. En ge¬ 
neral, una función sobre un espacio vectorial que asigna a cada 
par de vectores u y v un número (u, v), sujeto a ciertos axiomas. 
Véase la sección 6.7. 

producto punto: Véase producto interior. 

proyección ortogonal de y sobre u (o sobre la recta que pasa 
por u y por el origen, para u A 0): El vector y definido por 

„ y-u 

y = -U. 

u-u 

proyección ortogonal de y sobre fT: El vector único yenW tal 
que y — y es ortogonal a W. Notación: y = proy w y. 
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punto espiral (de un sistema dinámico en IR 2 ): El origen cuando las 
trayectorias caen en espiral hacia 0. 

punto extremo (de un conjunto convexo S): Un punto p en 5 tal que 
p no está en el interior de cualquier segmento de recta contenido 
en S. (Es decir, si x, y están en S, y p está sobre el segmento de 
recta xy, entonces p = x o p = y). 

punto frontera de un conjunto S en IR": Un punto p tal que cada bola 
abierta en IR" centrada en p se interseca tanto con S como con el 
complemento de S. 

punto interior (de un conjunto S en IR"): Un punto p en S tal que 
para alguna S > 0, la bola abierta B(p, S) centrada en p está 
contenida en S. 

punto silla (de un sistema dinámico en IR 2 ): El origen cuando al¬ 
gunas trayectorias son atraídas hacia 0 y otras trayectorias son 
repelidas desde 0. 

R 

rango (de una matriz A): La dimensión del espacio columna de A, 
que se denota como rango A. 

rango (de una transformación lineal T): El conjunto de todos los 
vectores de la forma 7\x) para alguna x en el dominio de T. 

Re x: El vector en IR" formado de las partes reales de las entradas de 
un vector x en C". 

recta de mínimos cuadrados: La recta y = /3o + ¡iix que minimiza 
el error de mínimos cuadrados en la ecuación y = X¡3 + e. 

recta que pasa por p paralela a v: El conjunto {p + / v: t en IR}. 

red en escalera: Una red eléctrica ensamblada que conecta en serie 
dos o más circuitos eléctricos. 

reflexión de Householder: Una transformación x >-» Qx. donde 
Q = 1 — 2uu r y u es un vector unitario (u r u =1). 

regla de Cramer: Una fórmula para cada entrada en la solución x 
de la ecuación Ax = b cuando A es una matriz invertible. 

regla del paralelogramo para la adición: Una interpretación geo¬ 
métrica de la suma de dos vectores u, v como la diagonal del 
paralelogramo determinado por u, v y 0. 

regla fila-columna: La regla para calcular un producto AB en el cual 
la entrada (ij) de AB es la suma de los productos de las entradas 
correspondientes de la fila i de A y columna j de B. 

regla fila-vector para calcular Ax: Regla para calcular un pro¬ 
ducto Ax en el cual la z-ésima entrada de Ax es la suma de los 
productos de las entradas correspondientes de la fila i de A y 
del vector x. 

regresión múltiple: Un modelo lineal que implica diversas variables 
independientes y una variable dependiente. 

relación de dependencia afín: Una ecuación de la forma nvi + 
••• + c p \p = 0. donde los pesos ci,..., c p no todos son cero y 

Ci + ••• + Cp = 0. 

relación de dependencia lineal: Una ecuación vectorial homo¬ 
génea donde se especifican todos los pesos y al menos un peso 
es distinto de cero. 

relación de recurrencia: Véase ecuación en diferencias. 

remplazo de filas: Una operación elemental de fila que sustituye 
una fila de una matriz por la suma de la fila y un múltiplo de 
otra fila. 


repulsor (de un sistema dinámico en IR 2 ): El origen cuando todas 
las trayectorias excepto la secuencia cero constante tienden a 
alejarse de 0. 

resta vectorial: Se calcula u + (— l)v y se escribe el resultado como 
u — v. 

rotación de Givens: Una transformación lineal de ¡R" a IR" em¬ 
pleada en programas computacionales para crear entradas 
cero en un vector (por lo general, una columna de una 
matriz). 

s 

señal (o señal discreta de tiempo): Una secuencia doblemente in¬ 
finita de números, {y*}; una función definida sobre los enteros; 
pertenece al espacio vectorial §. 

serie de Fourier: Una serie infinita que converge a una función en el 
espacio con producto interior C[0, 2 tt], con el producto interior 
dado por una integral definida. 

seudoinversa (de A): La matriz VD~ l U T , cuando UDV T es una 
descomposición en valores singulares reducida de A. 

simplejo: La envolvente convexa de un conjunto finito de vectores 
en IR" afínmente independientes. 

sistema de ecuaciones lineales (o sistema lineal): Una colección de 
una o más ecuaciones lineales que implican el mismo conjunto 
de variables, por ejemplo, x \,..., x n . 

sistema desacoplado: Una ecuación en diferencias yy ( | = Ay^, o 
una ecuación diferencial y ’{t) = Ay(í), en la cual A es una matriz 
diagonal. La evolución discreta de cada entrada en y¿ (como una 
función de k), o la evolución continua de cada entrada en la 
función vectorial y(f), no sufren alteración por lo que ocurre con 
las otras entradas conforme k —» °° o t —» °o. 

sistema dinámico: Véase sistema dinámico lineal discreto. 

sistema dinámico lineal discreto: Una ecuación en diferencias de 
la forma x¿ + i = Ax* que describe los cambios en un sistema 
(por lo general, un sistema físico) conforme pasa el tiempo. 
El sistema físico se mide en tiempos discretos, cuando k = 0, 
1 , 2 ,..., y el estado del sistema al tiempo k es un vector x* 
cuyas entradas indican ciertos hechos de interés sobre el 
sistema. 

sistema lineal: Una colección de una o más ecuaciones lineales que 
implica las mismas variables, por ejemplo, x \,..., x„. 

sistema lineal consistente: Un sistema lineal con al menos una 
solución. 

sistema lineal inconsistente: Un sistema lineal que carece de so¬ 
lución. 

sistema sobredeterminado: Un sistema de ecuaciones con más 
ecuaciones que incógnitas. 

sistema subdeterminado: Un sistema de ecuaciones con menos 
ecuaciones que incógnitas. 

sistemas (lineales) equivalentes: Sistemas lineales con el mismo 
conjunto solución. 

sólido regular: Uno de los cinco posibles poliedros regulares 
en IR 3 : el tetraedro (4 caras triangulares iguales), el cubo (6 
caras cuadradas), el octaedro (8 caras triangulares iguales), 
el dodecaedro (12 caras pentagonales iguales), y el icosaedro 
(20 caras triangulares iguales). 
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solución (de un sistema lineal que implica las variables xi,,x„): 
Una lista (si, í 2 ,. . s„) de números que hacen que cada ecuación 
en el sistema sea un enunciado verdadero cuando los valores 
si,..., s„ se sustituyen para xi...., x„, respectivamente. 

solución de mínimos cuadrados (de Ax = b): Un vector x tal que 
||b — Ax|| < ||b — Ax|| para toda x en IR". 

solución general (de un sistema lineal): Una descripción paramétri¬ 
ca de un conjunto solución que expresa las variables básicas 
en términos de las variables libres (los parámetros), si las hay. 
Después de la sección 1.5, la descripción paramétrica se escri¬ 
be en forma vectorial. 

solución no trivial: Una solución distinta de cero de una ecuación 
homogénea o de un sistema de ecuaciones homogéneas. 

solución trivial: La solución x = 0 de una ecuación homogénea 
Ax = 0. 

subconjunto propio de un conjunto S: Un subconjunto de S que 
no es igual a S mismo. 

subespacio: Un subconjunto H de algún espacio vectorial V tal 
que H tiene estas propiedades: 1. El vector cero de V está 
en H: 2. H es cerrado bajo suma vectorial; y 3. H es cerrado 
bajo multiplicación por escalares. 

subespacio cero: El subespacio {0} que consta solamente del vector 
cero. 

subespacio invariante (para A): Un subespacio H tal que Ax está 
en H siempre que x se encuentre en H. 

subespacio propio: Cualquier subespacio de un espacio vectorial V 
diferente de V. 

subespacios fundamentales (determinados por A): El espacio nulo y 
el espacio columna de A, y el espacio nulo y el espacio columna 
de A r , con Col A T comúnmente llamado el espacio fila de A. 

submatriz (de A): Cualquier matriz que se obtiene al eliminar algu¬ 
nas filas y/o columnas de A; también, la propia A. 

suma de columna: La suma de las entradas en una columna de una 
matriz. 

suma de fila: La suma de las entradas en una fila de una matriz. 

suma vectorial: Operación que consiste en sumar vectores mediante 
la adición de las correspondientes entradas. 

sustitución regresiva (con notación matricial): La fase regresiva 
de reducción por filas de una matriz aumentada que transfor¬ 
ma una matriz escalonada en una matriz escalonada reducida; 
se utiliza para obtener la solución (o soluciones) de un sistema 
de ecuaciones lineales. 

T 

tamaño (de una matriz): Dos números, escritos en la forma m x n, 
que especifican el número de filas (m) y de columnas (n) en la 
matriz. 

tetraedro: Un objeto sólido tridimensional acotado por cuatro caras 
triangulares iguales, con tres caras que se encuentran en cada 
vértice. 

transformación (o función, o mapeo) T de IR" a IR'": Una regla 
que asigna a cada vector x en IR" un único vector T(x) en IR'". 
Notación: T : IR" —> IR'". Además, T : V —» 1L denota una regla 
que asigna a cada x en V un único vector 7Tx) en W. 


transformación afín: Un mapeo T : IR" —> IR'" de la forma T(x) = 
Ax + b, con una matriz A de m x n y b en IR"', 
transformación de semejanza: Una transformación que cambia A 
a la forma P~ 1 AP. 

transformación lineal invertible: Una transformación lineal 
T : IR" —> IR" tal que existe una función S : IR" —> IR" que satis¬ 
face tanto T(S(x)) = x como S(T(x)) = x para toda x en IR", 
transformación lineal T (de un espacio vectorial V a un espacio 
vectorial W): Una regla T que asigna a cada vector x en V un 
único vector T(x) en W, tal que i. L(u + v) = 7\u) + T(\) para 
toda u, v en V, y ii. L(cu) = cTfu) para toda u en V y todos los 
escalares c. Notación: T : V —> W\ también, x ^ Ax cuando 
T: IR" —> IR”' y A es la matriz estándar para T. 
transformación matricial: Un mapeo x i-> Ax, donde A es una 
matriz denxnyx representa cualquier vector en IR", 
transpuesta (de A): Una matriz A r de n x m, cuyas columnas son 
las filas correspondientes de la matriz A de m x n. 
traslación (por un vector p): La operación de sumar p a un vector 
o a cada vector en un conjunto dado, 
trayectoria: La gráfica de una solución [xo, Xi, X 2 ,... J de un sistema 
dinámico x¿ + i = Ax*; los puntos a menudo están conectados 
por una delgada curva, para facilitar la visualización de la 
trayectoria. Además, la gráfica x(f) para (£0, cuando x(í) es 
una solución de una ecuación diferencial x'(í) = Ax(t). 
traza (de una matriz cuadrada A): La suma de las entradas diagonales 
en A; se denota como tr A. 

triangular superior en bloques (matriz): Una matriz particionada 
A — [A¡¡\ tal que cada bloque A¡¡ es una matriz cero para i > j. 

V 

valor propio (de A): Un escalar A tal que la ecuación Ax = Ax tiene 
una solución para algún vector x distinto de cero. 

valor propio complejo: Una raíz no real de la ecuación caracterís¬ 
tica de una matriz de n x n. 

valor propio estrictamente dominante: Un valor propio Ai de 
una matriz A con la propiedad de que | Ai| > |A*| para todos 
los otros valor propios A* de A. 

valores singulares (de A): Las raíces cuadradas (positivas) de los 
valores propios de A T A, arregladas en orden decreciente de 
magnitud. 

variable básica: Una variable en un sistema lineal que corresponde 
a una columna pivote en la matriz de coeficientes, 
variable libre: Cualquier variable en un sistema lineal que no es una 
variable básica. 

variables no correlacionadas: Cualesquiera dos variables x¡ y x¡ 
(con i A yj que incluyen las i-ésima y y-ésima coordenadas de 
los vectores de observación en una matriz de observación, de tal 
forma que la covarianza s¡j es cero, 
varianza (de una variable xj): La entrada diagonal Sj¡ en la matriz de 
covarianza S para una matriz de observaciones, donde x¡ varía 
sobre lay-ésima coordenada de los vectores de observaciones. 

varianza total: La traza de la matriz de covarianza S de una matriz 
de observaciones. 

vector: Una lista de números; una matriz con una sola columna. En 
general, cualquier elemento de un espacio vectorial. 
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vector cero: El vector único, que se denota por 0 , tal que u + 0 = u 
para toda u. En R", 0 es el vector cuyas entradas son todas 
iguales a cero. 

vector columna: Una matriz con una sola columna, o una sola 
columna de una matriz que tiene varias columnas. 

vector coordenado de x respecto de B: El vector [x]b cuyas entra¬ 
das son las coordenadas de x respecto de la base B. 

vector de consumo unitario: Un vector columna en el modelo de 
entrada y salida de Leontief, que lista las entradas que un sector 
necesita por cada unidad de su salida; una columna de la matriz 
de consumo. 

vector de demanda final (o cuenta de demandas finales): El vec¬ 
tor d en el modelo de entrada y salida de Leontief que lista los 
valores en dólares de los bienes y servicios requeridos por va¬ 
rios sectores de la parte no productiva de la economía. El vector 
d puede representar la demanda de los consumidores, consumo 
gubernamental, excedente de producción, exportaciones, u otras 
demandas externas. 

vector de equilibrio: Véase vector de estado estable. 

vector de estado: Un vector de probabilidad. En general, un vector 
que describe el “estado” de un sistema físico, frecuentemente en 
conexión con una ecuación en diferencias x*+i = Ax*. 

vector de estado estable (para una matriz estocástica P ): Un vector 
de probabilidad q tal que Pq = q. 

vector de observaciones: El vector y en el modelo lineal y = 
X[3 + e, donde las entradas en y son los valores observados 
de una variable dependiente. 

vector de parámetros: El vector incógnita ¡3 en el modelo lineal 
y=X[3 + e. 


vector de probabilidad: Un vector en R" cuyas entradas son no 
negativas y suman uno. 

vector de producción: El vector en el modelo entrada y salida de 
Leontief que lista las cantidades que producirán los diversos 
sectores de una economía. 

vector fila: Una matriz con una sola fila, o bien, una fila de una 
matriz que tiene varias filas. 

vector normal (a un subespacio V de R"): Un vector n en R" tal 
que n-x = 0 para toda x en V. 

vector propio (de A): Un vector x distinto de cero tal que Ax = Ax 
para algún escalar A. 

vector propio complejo: Un vector distinto de cero x en C" tal 
que Ax = Ax, donde A es una matriz de n x n, y A es un valor 
propio complejo. 

vector residual: La cantidad e que aparece en el modelo lineal 
general: y = X/3 + e; es decir, e = y — Xf3, la diferencia entre 
los valores observados y los valores predichos (de y). 

vector unitario: Un vector v tal que ||v|| = 1. 

vectores iguales: Vectores en R” cuyas entradas correspondientes 
son las mismas. 

vectores linealmente independientes: Un conjunto indexado 
¡vi,..., \ p } con la propiedad de que la ecuación vectorial 
CiVi + C 2 V 2 + •■• + c p Yp = 0 solamente tiene la solución 
trivial, ci = ••• = c p = 0. 

vectores singulares derechos (de A): Las columnas de V en la 
descomposición de valores singulares A = UXV T . 

vectores singulares izquierdos (de A): Las columnas de U en 
la descomposición en valores singulares de A = UXV T . 



Respuestas a los ejercicios 
con numeración impar 


Capítulo 1 

Sección 1.1, página 10 

1. La solución es (x\, X 2 ) = ( — 8 , 3), o simplemente, ( — 8 , 3). 

3. ( 2 , 1 ) 

5. Remplazar la Fila 2 por su suma con —4 por la Fila 3, y 
después sustituya la Fila 1 por su suma con 3 por la Fila 3. 

7. El conjunto solución es vacío. 

9. (16,21,14,4) 11. Inconsistente 

13. (5, 3,-1) 15. Inconsistente 

17. Los cálculos indican que el sistema es inconsistente, de manera 

que las tres rectas no tienen punto en común. 

19. h # 2 21. Para toda h. 

23. Sugerencia: Marque un enunciado como verdadero solamente 
si siempre es verdadero. Dar aquí las respuestas sería frustrar la 
finalidad de las preguntas falso-verdadero, las cuales pretenden 
ayudarle a leer con cuidado el libro. 


'1 2 4 8 

Columnas pivote 1 y 3: 2 4 6 8 

_ 3 6 9 12 _ 



1 X1 = \x 2 - fx 3 

x 2 es libre. 
x¡ es libre. 


Xi = 5 + 3 x 5 
X 2 = 1 + 4x 5 
13. < X 3 es libre. 
x 4 = 4 — 9x 5 
X 5 es libre. 


15. a) Consistente, con muchas soluciones. 
b) Consistente, con muchas soluciones. 


25. k - 2g + h = 0 


17. Para toda h. 


27. La reducción por filas de 
f a b f j I" a 


í 

r J a [l 


indica que d — b(-) debe ser diferente de cero, ya que / y g 
son arbitrarias. De otra forma, para algunas elecciones de / y g 
la segunda fila podría corresponder a una ecuación de la forma 
0 = q, donde q es diferente de cero. Por lo tanto, ad be. 


19. a) Inconsistente cuando h = 2 y k + 8 . 

b) Solución única cuando h =£ 2. 

c) Muchas soluciones cuando h = 2 y k = 8 . 

21. Sugerencia: Lea el texto con cuidado y escriba las respuestas. 
Recuerde, un enunciado es verdadero solo si es cierto en 
todos los casos. 


29. Intercambie las Filas 1 y 3; intercambie las Filas 1 y 3. 

31. Remplace la Fila 3 por la Fila 3 + (—4)Fila 1; remplace la 
Fila 3 por la Fila 3 + (4)Fila 1. 

33. Sugerencia: Revise el problema de práctica 1 y después 
escriba una solución. 

Sección 1.2, página 21 

1. Forma escalonada reducida: a y b. Forma escalonada: d. 
No está en forma escalonada: c. 

'1 2 0 - 8 ' 

3. 0 0 1 4 

_ 0 0 0 0 _ 


23. Como hay cuatro pivotes (uno en cada columna de la matriz 
de coeficientes), la matriz aumentada se debe reducir a la 
forma 

" 1 0 0 0 a~ 

0 10 0/t 

0 0 10c 

0 0 0 1 d_ 

y así, 

Xi = a 

x 2 = b 
x 3 = c 
x 4 = d 

A17 
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Sin importar los valores de a, b, c y d, la solución existe y 
es única. 

25. Si la matriz de coeficientes tiene una posición pivote en cada 
fila, entonces existe una posición pivote en la fila inferior, y 
no hay lugar para un pivote en la columna aumentada. Así, de 
acuerdo con el teorema 2 , el sistema es consistente. 

27. Si un sistema lineal es consistente, entonces la solución es 
única si y solo si cada columna de Ia matriz de coeficientes 
es una columna pivote; de lo contrario, existe una infinidad 
de soluciones. 

29. Un sistema subdeterminado siempre tiene más variables que 
ecuaciones. No pueden existir más variables básicas que ecua¬ 
ciones, así que al menos una variable es libre. A tal variable 
se le puede asignar una infinidad de valores distintos. Si el 
sistema es consistente, entonces cada valor diferente de una 
variable libre producirá una solución distinta. 



11. No. b no es una combinación lineal de ai, a 2 y ^ 3 - 

13. No. b no es una combinación lineal de las columnas de A. 

15. h = 3. 


17. Desde luego, son aceptables los pesos que no son enteros, pero 
algunas elecciones sencillas son 0 ■ vi + 0 ■ V 2 = 0 . y 


1 • Vi + 0 • v 2 



0 • Vi + 1 • v 2 



1 • Vi + 1 • V2 




31. Sí, un sistema de ecuaciones lineales con más ecuaciones que 
incógnitas puede ser consistente. El siguiente sistema tiene 
una solución (x\ = X 2 = 1 ): 

Xi + x 2 = 2 
X\ — x 2 = 0 
3xi + 2x 2 = 5 


19. Gen {vi, v 2 ) es el conjunto de puntos sobre la recta que pasa 
por vi y 0, ya que V2 es un múltiplo de Vi. 


Sugerencia: Demuestre que 


es consistente 


para toda h y k. Explique qué indica este cálculo acerca 
de Gen {u, v}. 


33. p(t) = 1 + 3t + 21 2 


Sección 1.3, página 32 

1 . r- 4 ipi 

1 j’ 4 



3xi + 5x 2 = 2 

—2xi = —3 
8 x 1 — 9x 2 = 8 


En general, no se muestran los pasos intermedios. 

7. a = u — 2v, b = 2u — 2v, c = 2u — 3.5v, d = 3u — 4v 
Sí, cada vector en IR 2 es una combinación lineal de u y v. 


23. Sugerencia: Lea con cuidado toda la sección. Ponga especial 
atención a las definiciones y los enunciados de teoremas, 
y también a cualquier observación que aparezca antes 
o después de ellos. 

25. a) No. tres. b ) Sí, un número infinito 

c) ai = 1 ■ ai + 0 • a 2 + 0 • 83 
27. a) 5vi es la salida de 5 días de operación de la mina #1. 

b ) La salida total es X 1 V 1 + x 2 v 2 , así que xi y x 2 deberían 

satisfacer X 1 V 1 + x 2 v 2 = 

c) [M] 1.73 días para la mina #1 y 4.70 días para la mina #2. 
29. (17/14, -34/14, 16/14) = (17/14, -17/7, 8/7) 

, T 10 / 3 1 

31. a) 2 

b) Sume 3.5 g en (0, 1), sume 0.5 g en (8, 1), y sume 2 g en 
(2, 4). 

33. Sugerencia: Revise el problema de práctica 1 y después escriba 
una solución. 



Sección 1.4, página 40 


1. El producto no está definido porque el número de columnas 
(2) en la matriz de 3 x 2 no concuerda con el número de 
entradas (3) en el vector. 


3. a) 
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1 • (—2) + 2 • (3) 
(-3) • (-2) + 1 • (3) 
1 • (—2) + 6 • (3) 


c 2 = 1 , c 3 = 2 , c 4 = —1, c s = 2 , y 








Presente su trabajo hasta aquí y también para los ejercicios 
4 a 6 , pero de aquí en adelante efectúe los cálculos 
mentalmente. 



13. Sí. (Justifique su respuesta). 

15. La ecuación Ax = b no es consistente cuando 3b¡ + b 2 es 

diferente de cero. (Muestre su trabajo). El conjunto de vectores 
b para los cuales la ecuación es consistente es una recta que 
pasa por el origen [el conjunto de todos los puntos (b 1 , b 2 ) 
que satisfacen b 2 = —3¿>i]. 

17. Solo tres filas contienen una posición pivote. De acuerdo con 
el teorema 4, la ecuación Ax = b no tiene una solución para 
cada b en R 4 . 

19. El trabajo del ejercicio 17 indica que el enunciado d ) en el 
teorema 4 es falso. De manera que los cuatro enunciados 
del teorema 4 son falsos. Por lo tanto, no todos los vectores 
en R 4 se pueden escribir como una combinación lineal de las 
columnas de A. Además, las columnas de A no generan a R 4 . 

21. La matriz [vi V 2 V 3 ] no tiene un pivote en cada fila, de 
manera que, de acuerdo con el teorema 4, las columnas de la 
matriz no generan a R 4 . Es decir, {vi, V 2 , V 3 } no genera a R 4 . 

23. Sugerencia: Lea el texto con cuidado y marque cada enunciado 
como verdadero o falso. Varias partes de los ejercicios 29 y 30 
son implicaciones de la forma 
“Si (enunciado 1), entonces, (enunciado 2)” 
o, de manera equivalente, 

“(enunciado 2 ), si (enunciado 1 }”. 

Marque tal implicación como verdadera si el <enunciado 
2 > es válido en todos los casos cuando el <enunciado 1 > es 
verdadero. 

25. ci = —3, C 2 = — 1, C 3 = 2. 

27. La ecuación matricial se puede escribir como 

ctvi + C 2 V 2 + C 3 V 3 + C 4 V 4 + C 5 V 5 = V 6 . donde ci = —3, 


29. Sugerencia: Inicie con cualquier matriz B de 3 x 3 en forma 
escalonada que tenga tres posiciones pivote. 

33. Sugerencia: Pregúntese cuántas posiciones pivote tiene A y 
por qué. 

35. Suponga que y y z satisfacen Ay = z. Entonces, 5z = 5Ay. 

De acuerdo con el teorema 5(b), 5Ay = A(5y). Así, 5z = A(5y), 
lo que muestra que 5y es una solución de Ax = 5z. Por lo 
tanto, la ecuación Ax = 5z es consistente. 

37. [M] Las columnas no generan a R 4 . 

39. [M] Las columnas generan a R 4 . 

41. [M] Elimine la columna 4 de la matriz del ejercicio 39. 
También es posible eliminar la columna 3 en vez de la 
columna 4. 


Sección 1.5, página 47 

1. El sistema tiene una solución no trivial porque existe una 
variable libre, * 3 . 

3. El sistema tiene una solución no trivial porque hay una 
variable libre, * 3 . 



7. x = 


9. x = 



11. Sugerencia: El sistema obtenido a partir de la forma 
escalonada reducida es 

X] — 4x 2 + 5x 6 = 0 

x 3 — x 6 = 0 
x 5 — 4x 6 = 0 
0 = 0 

Las variables básicas son x\, X 3 y X 5 . Las restantes variables 
son libres. 
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15. Sean u = 

5“ 

1 

, y = 

■ 3 " 

0 

p = 

1 

<N O 

1 

1_ 


0 


1 


°J 


. La solución de la 


ecuación homogénea es x = x 2 u + X 3 V, el plano que pasa por 
el origen generado por u y v. El conjunto solución del sistema 
no homogéneo es x = p + x 2 u + X 3 V, el plano que pasa por p 
paralelo al conjunto solución de la ecuación homogénea. 


17. x = 

Xl 

X2 

_ 

8 “ 

-4 

+ X 3 

'-1 ' 
-1 


_ +3 _ 


0 

r 

«I 

1 


recta que pasa por 


. El conjunto solución es la 


paralela a la recta que es el conjunto 


solución del sistema homogéneo del ejercicio 5. 


19. x — a + t b, donde t representa un parámetro, o 


x = 


x¡ 

x 2 




—2 — 5t 
3 1 


21. x = p + ?(q - p) = 

25. a) Aw = A( p + \ h ) = Ap + A\ h = b + 0 = b 
b ) A\h = A(w — p) = Aw — Ap = b — b = 0 



27. (Argumento geométrico con base en el teorema 6) Como la 
ecuación Ax = b es consistente, entonces, de acuerdo con 
el teorema 6, su conjunto solución se obtiene trasladando el 
conjunto solución de Ax = 0. Así, el conjunto solución de 
Ax = b es un solo vector si y solo si el conjunto solución 
de Ax = 0 es un solo vector, y eso ocurre si y solo si Ax = 0 
solamente tiene la solución trivial. 

(Demostración con variables libres ) Si Ax = b tiene una 
solución, entonces la solución es única si y solo si no hay 
variables libres en el sistema de ecuaciones correspondiente, 
es decir, si y solo si toda columna de A es una columna pivote. 
Esto ocurre si y solo si la ecuación Ax = 0 tiene solamente la 
solución trivial. 


29. a) Cuando A es una matriz de 4 x 4 con tres posiciones pivote, 
la ecuación Ax = 0 tiene una variable libre y, por lo tanto, 
tiene soluciones no triviales. 

b ) Con tres posiciones pivote, A no tiene una posición pivote 
en cada una de sus cuatro filas. Según el teorema 4 de la 
sección 1.4, la ecuación Ax = b no tiene una solución 
para cada posible b. La palabra “posible” en el ejercicio 
significa que los únicos vectores considerados en este caso 
son los que están en IR 4 , esto porque A tiene cuatro filas. 

31. a) Cuando A es una matriz de 3 x 2 con dos posiciones pivotes, 
cada columna es una columna pivote. Así, la ecuación 
Ax = 0 no tiene variables libres y, por consiguiente, 
no tiene solución no trivial. 

b) Con dos posiciones pivote y tres renglones, A no puede 
tener un pivote en cada renglón. Así, de acuerdo con 
el teorema 4 de la sección 1.4, la ecuación Ax = b no 
puede tener una solución para cada posible b (en R 3 ). 


33. Su ejemplo debería tener la propiedad de que la suma de las 
entradas en cada fila es cero. ¿Por qué? 

35. Una respuesta: x = I" ^ 1. 


37. Una respuesta es A 


1 

1 



Si b es cualquier vector 


que no es múltiplo de la primera columna de A, entonces el 
conjunto solución de Ax = b es vacío y, por lo tanto, no se 
puede formar al trasladar el conjunto solución de Ax = 0. 
Esto no contradice el teorema 6 porque este último se aplica 
cuando la ecuación Ax = b tiene un conjunto solución que 
no es vacío. 


39. Suponga que Av = 0 y Aw = 0. Entonces, como 

A(v + w) = Av + Aw, de acuerdo con el teorema 5(a) 
de la sección 1.4, A(v + w) = Av + Aw = 0 + 0 = 0. 
Ahora, sean c y d escalares. Utilizando ambas partes del 
teorema 5, A(cv + d w) = A(cv) + A(d w) = cAv + 
¿Aw = cO + í/0 = 0. 


Sección 1.6, página 54 

1. La solución general es pg = 0.875ps, con Ps libre. 

Una solución de equilibrio esps = 1000 y pb = 875. 
Empleando fracciones, la solución general se podría escribir 
comopg — (7/8)ps, y una elección natural de precios 
podría ser p$ = 80 y pg — 70. Solo la razón de precios es 
importante. El equilibrio económico no se altera por el cambio 
proporcional en los precios. 

3. a) 


Distribución de la 
producción de: 

C y E Man. Serv. 


Salida 

1 

1 

1 

Entrada 

Comprados por: 


.1 

.1 

.2 

- 

► 

C y E 


.8 

.1 

.4 

-► 

Man. 


.1 

.8 

.4 

— 

Serv. 

.9 

-.1 


-.2 

0“ 



-.8 

.9 


-.4 

0 



-.1 

-.8 


.6 

0 




c) [M] p cyE ~ 30, p M = 71, Ps = 100. 
5. a) 


Distribución de la producción de: 


Agr. 

Man. 

Serv. Transp. 



Salida 1 

1 

1 

1 

Entrada 

Comprados por: 

.20 

.35 

.10 

.20 

-► 

Agr. 

.20 

.10 

.20 

.30 

-► 

Man. 

.30 

.35 

.50 

.20 

► 

Serv. 

.30 

.20 

.20 

.30 

— 

Transp. 

b ) Una solución es pa 

= 7.99, p M = 

8.36, p s 

= 14.65, 


y Pt = 10.00. 
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c) Distribución de la producción de: 

Agr. Man. Serv. Transp. 

Salida III I Entrada Comprados por: 


.20 

.35 

.10 

.20 

Agr. 

.10 

.10 

.20 

.30 

► Man. 

.40 

.35 

.50 

.20 

—► Serv. 

.30 

.20 

.20 

.30 

—► Transp. 


d) Una solución es p a = 7.81. pm = 7.67, ps = 15.62, 
y pr = 10.00. 

La campaña ha beneficiado sobre todo al sector de servicios. 


7. 3NaHC0 3 + H 3 C 6 H 5 07 -»• Na 3 C 6 H 5 0 7 + 3H 2 0 + 3C0 2 
9. B 2 S 3 + 6H 2 0 2H 3 B0 3 + 3H 2 S 

11. [M] 16MnS + 13As 2 Cr 10 O 35 + 3 74H 2 S0 4 

16HMn0 4 + 26 AsH 3 + 130CrS 3 O 12 + 327H 2 Q 


Xi = x 3 — 40 


x 2 = x 3 + 10 

íx 2 = 50 

x 3 es libre 

h 

II 

0 

x 4 = x 6 + 50 

x 4 = 50 

x 5 = x 6 + 60 

* 

II 

OS 

O 

Xg es libre 



15. 


' 

xi = 60 + xg 

x 2 = —10 4- X6 
x 3 = 90 + xg 

X 4 = X6 

x 5 = 80 + x 6 
Xg es libre 


Para que el flujo sea no negativo, X6 > 10. 


Sección 1.7, pág. 60 

Justifique sus respuestas a los ejercicios 1 a 22. 

1. Linealmente independientes. 3. Linealmente dependientes. 
5. Linealmente independiente. 7. Linealmente dependiente. 

9. a) Ninguna h. b) Para toda h. 

13. Para toda h. 


0 

0 


27. Las cuatro columnas de la matriz A de 6 x 4 deben ser 

columnas pivote. De lo contrario, la ecuación Ax = 0 tendría 
una variable libre; en tal caso, las columnas de A serían 
linealmente dependientes. 


11. h = -4. 

15. Linealmente dependientes 
17. Linealmente dependientes 
19. Linealmente independientes 


23. 


25. 


0 



■ 

O 

’ 

O 

O 


29. A: Cualquier matriz de 3 x 2 cuya segunda columna es un 
múltiplo de la primera tendrá la propiedad deseada. 

B: Funcionará cualquier matriz de 3 x 2 con dos columnas 
diferentes de cero tales que ninguna de ellas sea múltiplo 
de la otra. En este caso, las columnas forman un conjunto 
linealmente independiente, y así la ecuación Bx = 0 solo 
tiene la solución trivial. 


31. x = 


1 

1 

-1 


33. Verdadero, según el teorema 7. 

35. Verdadero, de acuerdo con el teorema 9. 

37. Verdadero. Una relación de dependencia lineal entre Vi, v 2 y v 3 
se puede ampliar a una relación de dependencia lineal entre 
vi, v 2 , v 3 y v 4 colocando un peso cero en v 4 . 

41. [M] Utilice las columnas pivote de A, 
r 3 -4 71 


L 8 -7 4 J 

Otras elecciones son posibles. 

43. [M] Cada columna de A que no es columna de B está en el 
conjunto generado por las columnas de B. 


Sección 1.8, página 68 

1 . 

5. x = 






■ 7 " 

2" 

-6 

* 

2 a 
2b 

* 

II 

6 




1 

3 


, solución única 


no es única 


7. a = 5 , b = 6 


9. x = x 3 


4 

3 

1 

0 


11. Sí, porque el sistema representado por [A b] es consistente. 


13. x 2 


v # 

u 

• ^ 


T( u) 



T(y) 


Reflexión a través del origen. 
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15. 


*2 


V • 

T( u) / 
/ 

/ 

/ 

/ 

/ 

/ / u 

/ 

L -— 

/ 


/ 


/ 


/ 


/ 

/ 

T(y) 

/ 


/ 




Reflexión a través de la recta x\ = x 2 . 



19. 


' 13' 


2xi — x 2 

7 _ 

’ 

5xi + 6x 2 


21. Sugerencia: Lea el texto con cuidado y escriba sus 

respuestas. Observe que el ejercicio 21e) es una oración 
de la forma 

“(enunciado 1) si y solo si (enunciado 2)”. 

Marque dicha oración como verdadera si el (enunciado 1) 
es válido siempre que el (enunciado 2) también lo sea y el 
(enunciado 2) es verdadero siempre que el (enunciado 1) 
sea verdadero. 


23. a) Cuando b — 0. f(x) = inx. En este caso, para toda x, y en IR 
y todos los escalares cy d, 

f(cx 4- dy ) = m(cx + dy) = mcx + mdy 
= c(mx) + d(my) 

= c- f(x) + d ■ f(y) 


29. * 2 

r(u + v) L(u) 
T(y) 


-.vi 



31. Sugerencia: Como {vi, v 2 , V 3 } es linealmente dependiente, 
se puede escribir cierta ecuación y trabajar con ella. 

33. Una posibilidad es demostrar que T no mapea el vector cero 
en el vector cero, algo que «hace toda transformación lineal: 
7X0, 0) = (0, -3, 0). 

35. Tome u y v en IR 3 y sean cy d escalares. Entonces, 

cu + dy = (cu 1 + dv\,cu2 + d v 2 , c ¡<3 + dv 3 ) 

La transformación T es lineal porque 

T(cu + dy) = (cui + dvi, 0 . cm 3 + dv 3 ) 

= (cu ¡.O, cu 3 ) + (dv\, 0, dvi) 

= c(u¡, 0 , m 3 ) + d(v i.O, u 3 ) 

= c7’(u) + dT(y) 

37. [M] Todos los múltiplos de ( — 1, — 1, 1,0) 

39. [M] Sí. Una elección para x es (1, 2, 0, 0). 


Esto demuestra que / es lineal. 

b) Cuando f(x) = mx + b, con b distinto de cero, 

/(0) = m( 0) + b = b * 0. 

c) En cálculo,/es una “función lineal” porque la gráfica de / 
es una recta. 


25. Sugerencia: Demuestre que la imagen de una recta (es decir, 
el conjunto de imágenes de todos los puntos sobre una recta) 
se puede representar por la ecuación paramétrica de una 
recta. 

27. Cualquier punto x sobre el plano P satisface la ecuación 
paramétrica x = íu + ty para algunos valores de sy t. 

Por linealidad, la imagen 7Tx) satisface la ecuación 
paramétrica 

T(x) = íTXu) + tT(y) (s, t en IR) (*) 


Sección 1.9, página 78 

'3 -5 

1 1 2 
3 0 

1 0 

[-1/V2 1/V2 

■ [ 1/V2 1/V2 


1 

■3 1 


0 


0 -1 
-1 0 


11. La transformación descrita T mapea ei en — ei y mapea e 2 
en —e 2 . Una rotación de 77 radianes también mapea ei en 
—d y mapea e 2 en — e 2 . Como una transformación lineal 
está completamente determinada por su acción sobre las 
columnas de la matriz identidad, entonces la transformación 
de rotación tiene el mismo efecto que T sobre cada vector 
en IR 2 . 


13. 


El conjunto de imágenes es justamente Gen {T(u), T(v)}. 
Si 7Tu) y T(y) son linealmente independientes, 

Gen ¡T(u), 7Tv)} es un plano a través de T(u), T(y), y 0. 
Si T( u) y T(y) son linealmente dependientes y no son 
nulos a la vez, entonces Gen ¡T(u), 7Tv)} es una recta 
que pasa por 0. Si T(u) = T(y) = 0, entonces 
Gen ¡T(u),r(v)} es {0j. 


T( 2, 1) 


TXeO 


T(e 2 ) 

-*1 
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15. 


2-4 0 

1 0 -1 
0-1 3 


17. 


1 

0 

0 

0 


2 

0 

2 

1 


19. 


1 

0 



21. x = 



25. No es uno a uno, y no mapea R 4 sobre IR 4 . 


0 

0" 

¡ 


12 

-1 

0 - 

0 

0 

II 

- 

-7 

15 

-6 

0 

1 


0 

-6 

14 - 

0 

-1 


- 

-4 

0 

-5 1 





~h~ 


' 11.43" 



[M]: i = 


h 


10.55 



= 

h 

= 

8.04 





u 


5.84 



' h 


40" 




30 


h 


20 


_U_ 


-10 


27. No es uno a uno, pero mapea R 3 sobre R : . 


29. 


9. x* + i = Mx¿ para k = 0, 1, 2,..., donde 





M = 

'.93 

.05" 

1 

" 800,000" 

■ 

* 

* 

_ .07 

.95 _ 

II 

O 

500,000 

0 

■ 

* 






0 

0 

■ 

La población 

en el 2012 (para k - 

= 2) es x 2 = 

0 

0 

0 







741,720 

558,280 


33. Sugerencia: Si e ; es lay'-ésima columna de /,„ entonces Be¡ es 
la y-ésima columna de B. 

35. Sugerencia: ¿Es posible que m > ni ¿Qué ocurre con m < ni 


11. a) M = 


.98363 

.01637 


.00167 

.99833 


b ) [M] x 6 = 


30,754,500 

229,449,000 


37. [M] No. (Explique por qué). 
39. [M] No. (Explique por qué). 
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1 . 


a) x¡ 


' 110" 


' 130" 


"295" 

4 

+ X 2 

3 


9 

20 

18 

— 

48 

2 


5 


8 


, donde x\ es el número 


13. [M] 

a) Disminuye la población de la ciudad. Después de 7 años, 
las poblaciones son aproximadamente iguales, pero la 
población de la ciudad continúa disminuyendo. Después 
de 20 años, en la ciudad solo hay 417,000 habitantes (valor 
redondeado a partir de 417,456). Sin embargo, cada año 
parecen reducirse los cambios en la población. 

b ) La población de la ciudad se incrementa lentamente y 
disminuye la población suburbana. Después de 20 años, la 
población de la ciudad ha crecido de 350,000 a cerca de 
370,000. 


de porciones de Cheerios, y x 2 es el número de porciones de 

100 % Natural Cereal. Capítulo i Ejercicios complementarios, página 88 


b) 


110 

4 

20 

2 


130 

3 

18 

5 




"295" 


x¡ 


9 


X2 


48 



8 


. Mezcle 1.5 porciones 


de Cheerios con 1 porción de 100% Natural Cereal. 


3. a) Debería mezclar 0.99 porciones de Mac and Cheese. 1.54 
porciones de brócoli, y 0.79 porciones de pollo para obtener 
el contenido nutricional deseado. 

b) Debería mezclar 1.09 porciones de pasta integral y queso 
cheddar, 0.88 porciones de brócoli, y 1.03 porciones de 
pollo para lograr el contenido nutricional deseado. Observe 
que esta mezcla contiene significativamente menos brócoli, 
así que a ella le debería gustar más. 


5. 


Ri = 


[M]: 


"11 -5 0 0" 


~h~ 


50" 

-5 10 -1 0 


h 


-40 

0-1 9-2 


h 


30 

0 0 -2 10 


_ f 4 _ 


-30 


'Ii' 


3.68" 

h 


-1.90 

h 


2.57 

_ 7 4_ 


-2.49 


a) F 

b) 

F 

c) 

V 

g) F 

h) 

F 

i) 

V 

ni) V 

n) 

V 

0 ) 

V 

s) F 

t) 

V 

u) 

F 

y) v 

z) 

F 




d ) F 

e) V 

/) v 

í) F 

k) V 

l) F 

P) v 

q) F 

r) V 

v) F 

w) F 

x) V 


3. a) Cualquier sistema lineal consistente cuya forma escalonada 
es 


■ 

* 

* 

* 


■ 

* 

* 

* 

0 

■ 

* 

* 

0 

0 

0 

■ 

* 

0 

0 

0 

0_ 


0 

0 

0 

0_ 


o 


0 

0 

0 


0 

0 


* 


0 


* 

* 


o 


b) Cualquier sistema lineal consistente cuya forma escalonada 
reducida es I 3 . 

c) Cualquier sistema lineal inconsistente de tres ecuaciones 
con tres variables. 


5. a) El conjunto solución: i. es vacío si h— 12 y k + 2; 

ii. contiene una única solución si h # 12; iii. contiene 
una infinidad de soluciones si /? = 12 y k = 2. 

b) El conjunto solución es vacío si k + 3 h = 0; de lo contrario, 
el conjunto solución contiene una única solución. 
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a) Sean Vi = 

b\ 

b = b 2 . “I 

_bi _ 

Solución: No. 


b) Sea A = 


-4 

v 2 = 1 

-5 


-2 

. v 3 = 1 

-3 


“Determine si Vi, \ 2 , v 3 generan IR 3 ”. 


—4 -2 
1 1 
—5 -3 


“Determine si las columnas 


de A generan IR 3 ”. 

c) Defina T(x) = Ax. “Determine si T mapea IR 3 sobre IR 3 ”. 

r 5 i_ 4 r 2 i, 7 r i i r 5 1 _ r 8 / 3 1 , r ? / 3 " 

9- l_ 6 J - 3 L 1 J + 3|_ 2 J°L 6 J _ L 4 / 3 J + L 14 / 3 

10. Sugerencia: Construya una “malla” sobre el plano X\X 2 
determinada por ai y a 2 . 

11. Un conjunto solución es una recta cuando el sistema tiene 
una variable libre. Si la matriz de coeficientes es de 2 x 3, 
entonces dos de las columnas deberían ser columnas pivote. 

r i 2 * i 

Por ejemplo, tome ^ ^ ^ • Ponga lo que sea en la 

columna 3. La matriz resultante estará en forma escalonada. 
Haga una operación de remplazo de filas sobre la segunda fila 
para crear una matriz que no esté en forma escalonada, 

, n 2 i~l I" i 2 i" 

tal como o 3 ! ~ ! 5 2 ■ 


tal como 


12. Sugerencia: ¿Cuántas variables libres hay en la ecuación 
Ax = 0? 

'1 0-3' 

13. E = 0 1 2 

0 0 0_ 

15. a) Si los tres vectores son linealmente independientes, 
entonces a, c y / deben ser diferentes de cero. 

b ) Los números a,..., f pueden tener cualesquiera valores. 

16. Sugerencia: Liste las columnas de derecha a izquierda 
como vi,..., V 4 . 

17. Sugerencia: Utilice el teorema 7. 

19. Sea M la recta que pasa por el origen que es paralela a la recta 
que pasa por vi, \ 2 y v 3 . Entonces, V 2 — Vi y v 3 — v 3 están en 
M. De manera que uno de esos dos vectores es múltiplo del 
otro, por ejemplo, V 2 — Vi = &(v 3 — vf). Esta ecuación produce 
una relación de dependencia lineal: (k — l)vi + V 2 — Lv 3 = 0 . 

Una segunda solución: Una ecuación paramétrica de la recta 
es x = vi + f(v 2 — Vi). Como v 3 está sobre la recta, existe 
alguna t 0 tal que v 3 = Vi + t 0 (\ 2 — Vi) = (1 — toM + íoV 2 . 

Así que v 3 es una combinación lineal de v¡ y \ 2 , y (vi, V 2 , v 3 ) 
es linealmente dependiente. 

'1 0 0" 

21. 0-1 0 23. a — 4/5, b = —3/5 

0 0 1_ 

25. a) El vector lista los números de apartamentos de 1, 2 y 3 
recámaras cuando se construyen x\ pisos del plan A. 

" 3 "I [41 [5" 

b) xi 7 + x 2 4 + x 3 3 

8 8 9 


c) [M] Utilice 2 pisos del plan A y 15 pisos del plan B. 
O bien, use 6 pisos del plan A, 2 pisos del plan B, y 
8 pisos del plan C. Esas son las únicas soluciones 
factibles. Hay otras soluciones matemáticas, pero 
requieren un número negativo (o una fracción) de 
pisos en uno o dos de los planes, lo cual carece 
de sentido físico. 


Capítulo 2 
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[-4 0 2] r 3 

‘ [-8 10 —4J’ |_ —7 

1 13] 

-7 —6 

I" 1 5] ["6 -15" 

[-3 5 J’ [9 -6_ 


-4 

0 

-8 

10 

1 

13 

-7 

-6 

1 

5" 

-3 

5 _ 

Ab! 

= 

AB 

_ 


, no está definida. 


b. AB = 


-10 

0 , Ab 2 = 
26 _ 

-10 11 " 

0 8 

26 —19 _ 

-1 • 4 + 3(—2) 
2 • 4 + 4(—2) 
5 • 4 — 3(—2) 
-10 11” 

0 8 

26 -19 


-1 (—2) + 3-3 
2 (-2) + 4-3 
5(—2) -3-3 


7. 

3x7 

9. 

k = -2 




5 

6 

6] [5 

10 

15" 

11 . 

AD = 10 

12 

10 , DA = 6 

12 

15 


15 

15 

12 J L 6 

10 

12 


La multiplicación por la derecha por D multiplica cada 
columna de A por la entrada diagonal correspondiente 
en D. La multiplicación por la izquierda por D multiplica 
cada fila de A por la entrada diagonal correspondiente en D. 

13. Sugerencia: Considere que una de las dos matrices es Q. 


7 k r 3 i. r 11 

7. b, = [ 2 J ’ b2 = [4 


19. La tercera columna de AB es la suma de las primeras dos 

columnas de AB. He aquí por qué. Escriba B = [b 2 b 2 b 3 ]. 
Por definición, la tercera columna de AB es Ab 3 . 

Si b 3 = bi + b 2 , entonces Ab 3 = A(bi + b 2 )= Abi + Ab 2 , 
debido a una propiedad de la multiplicación matriz-vector. 

21. Las columnas de A son linealmente dependientes. 

¿Por qué? 

23. Sugerencia: Suponga que x satisface Ax = 0, y demuestre 
que x debe ser 0. 
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25. Sugerencia: Utilice los resultados de los ejercicios 23 y 24, y 
aplique la ley asociativa de la multiplicación al producto CAD. 

27. u r v = v r u = —3 a + 2b — 5c, 


—3a 

-3 b 

-3 c 

2 a 

2 b 

2 c 

—5a 

—5b 

—5c 

—3a 

2 a 

—5a 

-3b 

2 b 

—5b 

-3c 

2 c 

—5c 



29. Sugerencia: De acuerdo con el teorema 2b), demuestre que 
la entrada (i, j) de A(B + C) es igual a la entrada (í, j) de 
AB + AC. 

31. Sugerencia: Utilice la definición del producto 7,„A y considere 
el hecho de que 7„,x = x para toda x en IR" 1 . 

33. Sugerencia: Primero escriba la entrada (i,j) de ( AB ) T , que es 
la entrada (j, i) de AB. Después, calcule la entrada (i.j) en 
B t A t , y considere el hecho de que las entradas en la fila i 
de B t son bu,..., b„¡, porque provienen de la columna i de B, 
y el hecho de que las entradas en la columna j de A T son 
a¡ i,..., ajn, ya que provienen de la fila j de A. 

35. [M] Aquí la respuesta depende de la elección del programa 
de matrices. Para MATLAB. utilice el comando help 
para leer sobre zeros, ones, eye y diag. Para la TI-86, 
estudie las instrucciones dim, f ill e iden. La TI-86 
no tiene un comando “diagonal”. 

37. [M] Muestre sus resultados e informe sus conclusiones. 

39. [M] Muestre sus resultados e informe sus conclusiones. 

41. Las matrices parecen aproximarse a la matriz 


1/3 

1/3 

1/3 

1/3 

1/3 

1/3 

1/3 

1/3 

1/3 
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r 2 - 3 i 

1 

'-3 -3' 


1 1 

1 

(N 

m 

1 

_ 1 

3 - -3 

6 7 _ 

0 

-2 -7/3_ 


5. x\ = 7 y X 2 = —9 


7. a y b: 



23. Sugerencia: Si Ax = 0 solo tiene la solución trivial, entonces 
no existen variables libres en la ecuación Ax = 0, y cada 
columna de A es una columna pivote. 


25. Sugerencia: Considere el caso a = b = 0. Después, considere 


el vector 


-b 

a 


, y considere el hecho de que ad — be = 0. 


27. Sugerencia: Para el inciso a), intercambie A y i? en el cuadro 
que sigue al ejemplo 6 de la sección 2.1, y luego remplace 
B por la matriz identidad. Para los incisos b) y c), inicie 
escribiendo 


A = 


filai (A) 
fila, (A) 
fila, (A) 


n o 


8 

3 

1 

— y j 

-4 1 

31. 

10 

4 

1 


7/2 

3/2 

i/2_ 


29. | 


33. La forma general de A 1 1 

1 0 
-1 1 
0 -1 

0 0 


A = B = 


-1 


1 


Sugerencia: Para j — 1,..., «, sean a,, I), y e ; las j-ésimas 
columnas de A, B e I, respectivamente. Considere que 
a,- — a,- n = e ; - y b, = e ; — e ; +i para j = 1,..., n — 1, 
y a. b„ e„. 


35. 


. Encuentre esto reduciendo por filas a [A e,]. 


37. C = 


39. [M] Las deflexiones son .62, .66 y .52 pulgadas, 
respectivamente. 

41. [M] .95, 6.19, 11.43 y 3.81 newtons, respectivamente. 


Sección 2.3, página 115 

La abreviación IMT denota el teorema de la matriz invertible ( Inver¬ 
tible Matrix Theorem, teorema 8). 


11. La demostración se puede modelar después de la demostración 
del teorema 5. 

13. AB = AC=>A- l AB = A- i AC=>IB = IC=>B=C. 

No, en general, B y C pueden ser diferentes cuando A no 
es invertible. Véase el ejercicio 10 de la sección 2.1. 

15. Sugerencia: A la matriz [A. B\, aplique las matrices elementales 
empleadas para reducir por filas A al. 

17. D = C^'TU'A -1 . Demuestre que D funciona. 

19. Después de encontrar X = CB — A, demuestre que X es una 
solución. 

21. Sugerencia: Considere la ecuación Ax = 0. 


1. Invertible, de acuerdo con el IMT. Ninguna columna de la 
matriz es un múltiplo de la otra columna, de manera que son 
linealmente independientes. Además, la matriz es invertible 
según el teorema 4 de la sección 2.2, ya que el determinante 
es diferente de cero. 

3. Observe que A T tiene un pivote en cada columna, de modo que 
de acuerdo con el IMT, A T es invertible. Entonces, según el 
IMT, A también es invertible. 

5. No es invertible, de acuerdo con el IMT. Como esta matriz 
tiene una columna de ceros, sus columnas forman un conjunto 
linealmente dependiente y, por consiguiente, la matriz no es 
invertible. 
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7. Invertible, de acuerdo con el IMT. La matriz se reduce por 
filas a 

-1-3 0 1 

0-480 
0 0 3 0 

0 0 0 1 

y tiene cuatro posiciones pivote. 

9. [M] La matriz de 4 x 4 tiene cuatro posiciones pivote, así que 

es invertible por el IMT. 

11. Sugerencia: Intente responder las preguntas apoyándose en una 
cuidadosa lectura del texto. 

13. Una matriz cuadrada triangular superior es invertible si y solo 
si todas las entradas de la diagonal son diferentes de cero. 

¿Por qué? 


35. Sugerencia: Para demostrar que T es uno a uno. suponga que 
T(u) = T(y) para algunos vectores u y v en IR". Deduzca 
que u = v. Para demostrar que T es sobre, suponga que y 
representa un vector arbitrario en IR" y utilice la inversa S 
para producir una x tal que 7Tx) = y. Es posible dar una 
segunda demostración empleando el teorema 9 junto con 
un teorema de la sección 1.9. 

37. Sugerencia: Considere las matrices estándar de T y U. 

39. Si T mapea R" sobre R", entonces, de acuerdo con el teorema 
12 de la sección 1.9, las columnas de su matriz estándar A 
generan R". Según el IMT, A es invertible. Así, de acuerdo con 
el teorema 9, T es invertible, y A -1 es la matriz estándar de 
T \ Como A -1 también es invertible, entonces, según el IMT, 
sus columnas son linealmente independientes y generan R". Al 
aplicar el teorema 12 de la sección 1.9 a la transformación T~ l 
se muestra que T _1 es un mapeo uno a uno de R" sobre R". 


Nota: Las respuestas que se muestran a continuación para los 

ejercicios 15 a 29 mencionan al IMT. En muchos casos, una parte 

o la totalidad de una respuesta aceptable también podría basarse 

en resultados que se emplearon para establecer el IMT. 

15. No, porque el enunciado h) del IMT entonces sería falso. 

Una matriz de 4 x 4 no puede ser invertible cuando sus 
columnas no generan R 4 . 

17. Si A tiene dos columnas idénticas, entonces sus columnas son 
linealmente dependientes. El inciso e) del IMT indica que A 
no puede ser invertible. 

19. D es invertible por el enunciado e) del IMT. Así, la ecuación 
Dx = b tiene una solución para cada b en R 7 , de acuerdo con 
el enunciado g) del IMT. ¿Podría agregar algo más? 

21. La matriz C no puede ser invertible, de acuerdo con el 
teorema 5 de la sección 2.2 o según el párrafo después 
del IMT. Así, el enunciado g) del IMT es falso y también 
lo es h). Las columnas de C no generan R". 

23. El enunciado g) del IMT es falso para F, de manera que 
también es falso el enunciado d). Es decir, la ecuación 
Fx = 0 tiene una solución no trivial. 

25. Sugerencia: Primero utilice el IMT. 

27. Sea W la inversa de AB. Entonces, ABW = I y A(BW) = I. 

Por desgracia, esta ecuación por sí misma no prueba que A 
es invertible. ¿Por qué no? Termine la demostración. 

29. Como la transformación x i-> Ax es uno a uno, entonces el 
enunciado /) del IMT es verdadero. También es verdadero el 
enunciado i), y la transformación x >—> Ax mapea R" sobre R". 
También, A es invertible, lo cual, de acuerdo con el teorema 9, 
implica que la transformación x i-> Ax es invertible. 

31. Sugerencia: Si la ecuación Ax = b tiene una solución para 
cada b, entonces A tiene un pivote en cada fila (teorema 4 
de la sección 1.4). ¿Podrían existir variables libres en una 
ecuación Ax = b? 

33. Sugerencia: Primero demuestre que la matriz estándar de T es 
invertible. Entonces, utilice un teorema o más para demostrar 

que T-\x) = Bx, donde B = 


1 9 

4 5 


41. [M] 

a) La solución exacta de (3) es x\ — 3.94 y X 2 — .49. La 
solución exacta de (4) es x¡ — 2.90 y *2 = 2.00. 

b ) Cuando la solución de (4) se emplea como una 
aproximación para la solución de (3), el error al usar 
el valor de 2.90 para x¡ es aproximadamente del 26%, 
y el error al utilizar 2.0 para *2 es de alrededor 

del 308%. 

c) El número de condición de la matriz de coeficientes 
es 3363. El cambio porcentual en la solución de (3) a 
(4) es cerca de 7700 veces el cambio porcentual en el 
lado derecho de la ecuación. Este es el mismo orden de 
magnitud que el número de condición. Este último da una 
medida aproximada de qué tan sensible es la solución de 
Ax = b ante cambios en b. Información adicional sobre 
el número de condición se presenta al final del capítulo 6 
y en el capítulo 7. 

43. [M] cond(A) ~ 69,000, que está entre 10 4 y 10 5 . Así que se 
pueden perder 4 o 5 dígitos de exactitud. Varios experimentos 
con MATLAB deberían comprobar que xyxi concuerdan 
a 11 o 12 dígitos. 

45. [M] Algunas versiones de MATLAB emiten una señal de 
alerta cuando se pide invertir una matriz de Hilbert de orden 
cercano a 12 o mayor, empleando aritmética de punto flotante. 
El producto AA~* debería tener varias entradas fuera de la 
diagonal que están lejos de ser cero. Si no, intente con una 
matriz más grande. 
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1 


A 

B 

3. 

C 

D~ 

EA + C 

EB + D 

A 

B 


5. Y — B 1 (explique por qué), X = — B 1 A, Z = C 

1. X = A -1 (¿por qué?), Y = —BA~ l , Z = 0 (¿por qué?) 

9 . A 2 i = — BiiB^ 1 , A 31 = — iLiBjj 1 , 

C22 = B22 — B2iB n l Bu 

13. Sugerencia: Suponga que A es invertible, y sea 
D E 

Demuestre que BD = I y CG = 1. 
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19. 


Esto implica que B y C son invertibles. ([Explique por qué!). 
Al contrario, suponga que B y C son invertibles. Para probar 
que A es invertible, indique cómo debería ser A -1 y 
compruebe que su propuesta funciona. 


15. G k +1 = \X k x* + i ] 


*1 

L x í+1 J 


— X k%[ + XH-ix[ +1 


= G k + x k+1 x‘ k+l 

Solo se necesita calcular el producto matricial exterior 
Xí+ixJ + 1 (y después se suma a GQ. 


obtener x¡. La ecuación A 2 iXi + A 22 X 2 = bi conduce 
a A 22 X 2 =bi — A 21 X 1 , de la que se puede obtener X 2 
mediante reducción por filas de la matriz [A 22 c], 
donde c = b 2 — A 21 X 1 . 
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'-7" 


3' 

1 . Ly = b => y = 

-2 

, Ux = y =b x = 

4 


6 


-6 


17. La inversa de 


I 0 
X I 


I o 
-X I 


. De manera similar, 


tiene una inversa. De la ecuación (7), se obtiene 


I 

0" 

^4 11 

A 12 

' I 

-Y' 


4n 

0 ' 

-X 

I 

_A 2 i 

A 22 _ 

0 

I 


0 

5 


I Y 
0 I 


(*) 


Si A es invertible, entonces la matriz del lado derecho de 
(*) es un producto de matrices invertibles y, por lo tanto, 
es invertible. De acuerdo con el ejercicio 13. An y S deben 
ser invertibles. 

VP(i) = /„, — C(A — sI n )~ l B. Este es el complemento de Schur 
de A — sl„ en la matriz del sistema. 


3. y = 


7. LU = 






1 " 


' 38 - 

6 


r- 5 i 

5. y = 

3 


16 

12 

0 

, X = 

1 

0 

1 

, X = 

8.5 



i_ _i 


-4 


-4 


1 

0' 

"2 

5 

-3/2 

1 

0 

7/2 


21. a) A 2 = 


b) M 2 = 


1 0 
2 -1 

1 + 0 
2-2 
A 0 
/ -A 

A 2 + 0 
A-A 


1 0 
2 -1 

0 + 0 
0+(-l) 2 . 
'A 0' 

I -A 

0 + 0 
o + (—A) 2 



1 

0 

0' 

'3 

1 

2' 

9. 

-3 

1 

0 

0 

3 

2 


3 

2 

1 

0 

0 

4 


1 

0 

0' 

'3 

7 

2' 

11 . 

2 

1 

0 

0 

5 

0 


-1 

1 

1 

0 

0 

5 


13. 


0 0' 
0 o 
1 o 
o 1 


0 -2 

0 0 


0 0 


3 -5 -3' 
3 1 

0 0 
0 0 



J 

0' 

J 


1 

0 

0" 

'2 

0 

5 

2' 

= 

1 

0 

15. 

-3 

1 

0 

0 

3 

2 

3 

- 

1 


2 

3 

1 

0 

0 

0 

4 


23. 


entonces escriba Ai = 


Si Ai y B\ son (k + 1) x (k + 1) y triangulares inferiores, 
a OH D _ T b O 7 " 

v A \ y Bl [w B 

donde Ay B son de k x k y triangulares inferiores, vyw 
están en IR*, y ay b son escalares adecuados. Suponga que 
el producto de matrices triangulares inferiores de k x k es 
una matriz triangular inferior, y calcule el producto Ai2?i. 
¿Qué se concluye? 


25. 


de la forma B = 


Utilice el ejercicio 13 para encontrar la inversa de una matriz 

Bu 0 ‘ 

0 B22 

es de q x q, y B es invertible. Particione la matriz A, y aplique 
dos veces su resultado para encontrar que 


, donde B\\ es de p x p, B 22 


A~‘ = 


-5 

3 

0 

0 

0 


2 

-1 

0 

0 

0 


o 

o 

1/2 

0 

o 


o 

o 

o 

3 

-5/2 


0' 

0 

0 

-4 

7/2 


1/2 -3/4 -2 

17. U~ l = | 0 -1/4 -1 

0 0 - 1/2 
1 0 0 

L~ l = | 2 1 0 

-2 -1 1 

3 5/4 -2 

3/2 3/4 -1 

1 1/2 - 1/2 


19. Sugerencia: Piense en aplicar reducción por filas a [A /]. 

21. Sugerencia: Represente las operaciones de fila mediante una 
secuencia de matrices elementales. 

23. a) Denote las filas de D como transpuestas de vectores 
columna. Entonces, con la multiplicación matricial 
particionada se obtiene 


27. 


a), b) Las instrucciones empleadas en estos ejercicios 
dependen del programa de matrices. 
c) El álgebra requerida viene de la ecuación matricial 
por bloques 


A = CD = [ d 


c 4 ] 


4n 

0 


Xi 


"bi" 

_a 2í 

A 22 _ 


_ x 2 _ 


b 2 


donde x¡ y bi están en IR 20 , y X 2 y b 2 están en IR 30 . 
Entonces, AnXi = bi, lo cual se puede resolver para 


Dvf 4 -b C4V4 


b) A tiene 40,000 entradas. Como C tiene 1600 entradas y 
D tiene 400 entradas, entonces juntas solo ocupan el 5% 
de la memoria necesaria para almacenar A. 



A28 Respuestas a los ejercicios con numeración impar 


25. Explique por qué U, D y V T son invertibles. Después, utilice 
un teorema sobre la inversa de un producto de matrices 
invertibles. 

27. a) 


b) 


V 1 

1/2 ohm 

V 2 

> 9/2 
>ohms 

V 3 


_ 

— 

f ‘ 2 t ¿2 

_ 

— 

/ 3 . 

V 1 

> 6 
> ohms 

V 2 

3/4 ohm 

V 3 


29. a) 


1 + Ri/Ri 

-l/*2 


-R\ — R¡ — ( R] R})/R2 
1 + Ri/R 2 


b) A = 


3 -12 

-1/3 5/3 


= 

' 1 

0 

-6' 

1 

1 

-1/3 

0 ' 

1 

'1 -2' 
0 1 


Sean R\ = 

2 ohms, R 2 = 

3 ohms y Rj = 1 

6 ohms 

[M] 


- 1 

0 

0 

0 

0 0 

0 0 


-.25 

1 

0 

0 

0 0 

0 0 


-.25 

-.0667 1 

0 

0 0 

0 0 

a) L = 

0 

—.2667 

' -.2857 

1 

0 0 

0 0 

0 

0 

-.2679 — 

.0833 

1 0 

0 0 


-.2917 -.2921 1 

0 -.2697 -.0861 


0 

1 

-.2931 


b) U = 


c) A 1 = 


Obtenga A -1 directamente y después calcule 
A~ l — Í7 _1 L _1 para comparar ambos métodos de 
inversión matricial. 
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1. C = 


'.10 

.60 

.60' 


"60' 

.30 

.20 

0 

| demanda | 

20 

.30 

.10 

.10 

’ (intermedia | 

10 


3. x = 


44.44 

16.67 

16.67 


5. x = 


110 

120 


7. a) 


1.6 

1.2 


b) 


111.6 

121.2 


c) Sugerencia: Encuentre una fórmula que implique (7 — C ) 


9. x = 


82.8 

131.0 

110.3 


'4 

-1 

-1 

0 

0 


0 


0 

0 - 




0 

3.75 

-.25 

—1 

0 


0 


0 

0 



" 1 .25 

0 

0 

3.7333 

- 1.0667 

-1 


0 


0 

0 


1. 

0 1 

0 

0 

0 

3.4286 

-.2857 

- 

-1 


0 

0 


0 

0 

0 

0 

3.7083 

- 1.0833 

-1 

0 



_° 0 

0 

0 

0 

0 

0 

3.3919 - 

.2921 

-1 




0 0 

0 

0 

0 

0 

0 

0 

0 

0 


0 

0 

3.7052 - 

0 

1.0861 

3 . 3868 . 


5. 

"1/V2 

1/V2 


- .2953 

.0866 

.0945 

.0509 

.0318 


.0227 

.0100 

.0082 

■ 


0 


.0866 

.2953 

.0509 

.0945 

.0227 


.0318 

.0082 

.0100 




.0945 

.0509 

.3271 

.1093 

.1045 


.0591 

.0318 

.0227 


' 1/2 


.0509 

.0945 

.1093 

.3271 

.0591 


.1045 

.0227 

.0318 



.0318 

.0227 

.1045 

.0591 

.3271 


.1093 

.0945 

.0509 

7. 

V3/2 


.0227 

.0318 

.0591 

.1045 

.1093 


.3271 

.0509 

.0945 


0 


.0100 

.0082 

.0318 

.0227 

.0945 


.0509 

.2953 

.0866 



..0082 

.0100 

.0227 

.0318 

.0509 


.0945 

.0866 

.2953 

_ 




11. Sugerencia: Utilice propiedades de transpuestas para 
obtener p r = p r C + \ T de manera que 
p r x = (p r C + \ T )x = p T Cx + v r x. Ahora calcule p r x 
con la ecuación de producción. 

13. [M] x = 

(99576, 97703, 51231, 131570, 49488, 329554, 13835). 

Las entradas en x sugieren más precisión en la respuesta 
que está garantizada por las entradas en d, que parece ser 
exacta quizá solamente al millar más cercano. Así que una 
respuesta más realista para x podría ser 
x = 1000 x (100, 98, 51, 132, 49, 330, 14). 

15. [M]x <12) es el primer vector cuyas entradas son exactas al 
millar más cercano. El cálculo de x (12) requiere cerca de 
1260 flops, mientras que la reducción por filas de [(/ — C)d] 
necesita solamente alrededor de 550 flops. Si C es mayor de 
20 x 20, entonces se necesitan menos flops para calcular x (12) 
mediante iteración que para determinar el vector de equilibrio 
x por reducción de filas. Conforme aumenta el tamaño de C, 
se incrementa la ventaja del método iterativo. También, cuando 
C se vuelve más dispersa para modelos grandes de economía, 
entonces se requieren menos iteraciones para una exactitud 
razonable. 


Sección 2.7, página 144 


0 
0 

1 

l/v/2 

-l/x/2 

o 

-V3/2 
1/2 
0 



"0 

-1 

-1' 

3. 

1 

0 

2 


0 

0 

1 


0 
o 
1 

3 + 4VT 
4-3x/3 
1 


Véase el problema de práctica. 

A{BD) requiere 800 multiplicaciones. ( AB)D necesita 408 
multiplicaciones. El primer método utiliza casi el doble de 
multiplicaciones. Si D tuviera 10,000 columnas, las cuentas 
serían 80,000 y 40,008, respectivamente. 


11. Considere el hecho de que 


1 


sec 1 p — tan ip sen <p = 


sen 2 ip 


eos <p eos 1 p 


13. 


eos (p 

. Primero aplique la 
transformación lineal A, y después traslade mediante p. 


" A 

P" 


' 1 

p’ 

' A 

0 ' 

_0 r 

1 


y 

1 

y 

1 

















Respuestas a los ejercicios con numeración impar A29 


10 0 0 

0 1/2 -V3/2 0 

0 s/í/2 1/2 0 

0 0 0 1 

19. El triángulo con vértices en (7, 2, 0), (7.5, 5, 0) y (5, 5, 0) 

2.2586 -1.0395 -.3473 ] [ X 1 l~ R~ 

21. [M] -1.3495 2.3441 .0696 Y = G 

.0910 -.3046 1.2777 _|[_zj |_ B _ 


15. (12,-6,-3) 17. 
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1. El conjunto es cerrado bajo sumas, pero no bajo multiplicación 
por un escalar negativo. (Bosqueje un ejemplo). 

3. El conjunto no es cerrado bajo sumas o múltiplos escalares. 

5. Sí. El sistema correspondiente a [v¡ V 2 w] es consistente. 

7. a) Los tres vectores Vi, V2 y V3. 

b) Una infinidad de vectores. 

c ) Sí, porque Ax = p tiene una solución. 

9. No, porque Ap A 0. 

11. p = 4 y q = 3. Nul A es un subespacio de IR 4 porque las 
soluciones de Ax = 0 deben tener cuatro entradas, para 
ajustar con las columnas de A. Col A es un subespacio 
de IR 3 porque cada vector columna tiene tres entradas. 

13. Para Nul A, elija (1, —2, 1, 0) o (— 1, 4, 0, 1), por ejemplo. 

Para Col A, seleccione cualquier columna de A. 

15. Sea A la matriz cuyas columnas son los vectores dados. 

Entonces, A es invertible porque su determinante es diferente 
de cero, y así sus columnas forman una base para IR 2 , de 
acuerdo con el IMT (o con el ejemplo 5). (Se podrían dar 
otras razones para la invertibilidad de A). 

17. Sea A la matriz cuyas columnas son los vectores dados. 

La reducción por filas muestra tres pivotes, así que A es 
invertible. Según el IMT, las columnas de A forman una 
base para IR 3 . 

19. Sea A la matriz de 3 x 2 cuyas columnas son los vectores 
dados. Las columnas de A posiblemente no puedan generar 
IR 3 porque A no puede tener un pivote en cada fila. Así, las 
columnas no son una base para IR 3 . (Estas son una base para 
un plano en IR 3 ). 

21. Sugerencia: Lea la sección con cuidado, y escriba sus 
respuestas. Esta sección tiene términos y conceptos 
clave que debe aprender antes de seguir adelante. 



25. Base para Col A: 



27. Construya una matriz A de 3 x 3 distinta de cero, y 
construya b como una combinación lineal conveniente 
de las columnas de A. 

29. Sugerencia: Se necesita una matriz distinta de cero cuyas 
columnas sean linealmente dependientes. 

31. Si Col F A IR 5 , entonces las columnas de F no generan IR 5 . 
Puesto que F es cuadrada, el IMT indica que F no es invertible 
y la ecuación Fx = 0 tiene una solución no trivial. Es decir, 
Nul F contiene un vector diferente de cero. Otra manera de 
describir esto es escribir Nul F A {0}. 

33. Si Nul C = {0}, entonces la ecuación Cx = 0 solo tiene la 
solución trivial. Como C es cuadrada, el IMT indica que C es 
invertible y la ecuación Cx = b tiene una solución para cada 
b en IR 6 . Además, cada solución es única de acuerdo con el 
teorema 5 de la sección 2.2. 

35. Si Nul B contiene vectores diferentes de cero, entonces la 
ecuación Bx = 0 tiene soluciones no triviales. Como B es 
cuadrada, el IMT indica que B no es invertible y las columnas 
de B no generan IR 5 . Así, Col B es un subespacio de IR 5 , pero 
Col B A IR 5 . 

37. [M] Muestre la forma escalonada reducida de A, y seleccione 
las columnas pivote de A como una base para Col A. 

Para Nul A, escriba la solución de Ax = 0 en forma 
vectorial paramétrica. 

Base para Col A: 


Base para Nul A: 


Sección 2.9, página 157 

1. x = 3bi + 2b 2 = 3 j + 2 = 1 

, m e r 4 "i r 2 i r 1 r L5 1 

3. 2 5. ] 7. [w] B = ,[x] e = 5 






A30 


Respuestas a los ejercicios con numeración impar 


Base para Nul A: 


-3 

1 

0 

0 


dim Nul A = 1 


11. B ase para Col A: 



dim Col A = 2 


Base para Nul A: 


2 “ 


'- 1 ' 

1 


0 

0 


0 

0 


1 

0 


0 


-1 

0 

-1 

0 

1 


dim Nul A = 3 


13. Los vectores vi, V 3 y V 4 forman una base para el subespacio 
dado, H. Así, dim H = 3. 


15. Col A = IR 4 , porque A tiene un pivote en cada fila, y así las 
columnas de A generan R 4 . Nul A no puede ser igual a R 2 
porque Nul A es un subespacio de R 6 . Sin embargo, es cierto 
que Nul A es bidimensional. La razón es que la ecuación 
Ax = 0 tiene dos variables libres, porque A tiene seis 
columnas, y solo cuatro de ellas son columnas pivote. 


19. El hecho de que el espacio solución de Ax = 0 tenga una 

base de tres vectores significa que dim Nul A = 3. Como una 
matriz A de 5 x 7 tiene siete columnas, entonces el teorema 
del rango indica que rango A = 7 — dim Nul A = 4. 


21. Una matriz de 9 x 8 tiene ocho columnas. De acuerdo con 
el teorema del rango, dim Nul A = 8 — rango A. Como el 
rango es 7, entonces dim Nul A — 1. Es decir, la dimensión 
del espacio solución de Ax = 0 es 1. 


23. Cree una matriz A de 3 x 5 con dos columnas pivote. 

Las restantes tres columnas corresponderán a variables libres 
en la ecuación Ax = 0. De manera que sí es posible 
la construcción deseada. 


m) F n ) V o) F p) V 

3. I 


5. A 2 = 2A — I. Multiplique por A: A 3 = 2A 2 — A. 

Sustituya A 2 = 2A — I: 

A 3 = 2(2A - I) - A = 3A - 21. 

Multiplique por A otra vez: A 4 = A(3A — 21) = 3A 2 — 2A. 
Otra vez sustituya la identidad A 2 = 2A — I: 

A 4 = 3(2A - I) - 2A = 4A - 31. 


' 10 

-1 ' 





'-3 

13' 

9 

10 

9. 




-8 

27 

—5 

-3 





11. a) p(xi ) = c 0 + CiX¡ H-1- c n —!x” 1 


= fila,(V) • 


Co 


L Cn— 1 


fila,(yc) = y¡ 


b ) Suponga que x \,.... x„ son distintos y suponga que Ve 

= 0 para algún vector c. Entonces, las entradas en c son 
los coeficientes de un polinomio cuyo valor es cero en 
los distintos puntos xi,..., x„. Sin embargo, un polinomio 
diferente de cero de grado n — 1 no puede tener n ceros, 
así que el polinomio debe ser idénticamente cero. Es decir, 
todas las entradas en c deben ser cero. Esto muestra que las 
columnas de V son linealmente independientes. 

c) Sugerencia: Cuando xi,. .., x n son diferentes, existe un 
vector c tal que Ve = y. ¿Por qué? 


13. a) P 2 = (uu r )(uu r ) = u(u r u)u r = u(l)u r = P 

b) P T = (uu 7 y = u TT u T = uu T = P 

c) Q 2 = (I -2P){I -2P) 

= I - I(2P) - 2PI + 2P(2P) 

= I — AP + 4 P 2 = /, debido al inciso a). 


15. La multiplicación por la izquierda por una matriz elemental 
produce una operación de fila elemental: 


25. Por definición, las p columnas de A generan Col A. 

Si dim Col A = p, entonces el conjunto generador de p 
columnas automáticamente es una base para Col A, de 
acuerdo con el teorema de la base. En particular, las 
columnas son linealmente independientes. 

27. a) Sugerencia: Las columnas de B generan W, y cada 
vector a ¡ está en W. El vector c ¡ está en R p ya que B 
tiene p columnas. 

b) Sugerencia: ¿Cuál es el tamaño de C? 

c) Sugerencia: ¿Cómo se relacionan B y C con A? 


B ~ E\B ~ E 2 E 1 B ~ E 2 E 2 E 1 B = C 

Así, B es equivalente por filas a C. Como las operaciones 
de fila son reversibles, C es equivalente por filas a B. 
(Alternativamente, muestre a C que cambia a B mediante 
operaciones de fila empleando las inversas de las E¡). 

17. Como B es de 4 x 6 (con más columnas que filas), sus 
seis columnas son linealmente dependientes y existe una 
x diferente de cero tal que Bx = 0. Así, ABx = A0 = 0. 
lo que indica que la matriz AB no es invertible, de acuerdo 
con el IMT. 


29. [M] Los cálculos deberían mostrar que la matriz [vi V 2 x] 
corresponden a un sistema consistente. El vector de 
S-coordenadas de x es ( 2 , — 1 ). 

Capítulo 2 Ejercicios complementarios, página 160 

1. a) V b) F c) V d) F e) F /) F 

g) V h) V i) V j) F k)V l) F 


19. [M] Con cuatro cifras decimales, conforme k se incrementa. 


.2857 

.2857 

.2857 

.4286 

.4286 

.4286 

.2857 

.2857 

.2857 

.2022 

.2022 

.2022 

.3708 

.3708 

.3708 

.4270 

.4270 

.4270 



Respuestas a los ejercicios con numeración impar A31 


o, en formato racional. 


Sección 3.2, página 175 


A k 


B k 


2/7 

2/7 

2/7 

3/7 

3/7 

3/7 

2/7 

2/7 

2/7 


18/89 18/89 18/89 
33/89 33/89 33/89 
38/89 38/89 38/89 


1. El intercambio de dos filas invierte el signo del determinante. 

3. Una operación de remplazo de filas no modifica el 
determinante. 

5. 3 7. 0 9. 3 11. 120 

13. 6 15. 35 17. -7 19. 14 


Capítulo 3 

Sección 3.1, página 167 

1. 1 3. -5 5. -23 7. 4 

9. 10. Inicie con la fila 3. 

11. —12. Inicie con la columna 1 o la fila 4. 

13. 6. Inicie con la fila 2 o la columna 2. 

15. 1 17. -5 

19. ad — be, cb — da. Intercambiando dos filas cambia el signo 
del determinante. 


21. Invertible 23. No es invertible 

25. Linealmente independiente. 

29. -32 


31. Sugerencia: Demuestre que (det A)(det A~') = 1. 
33. Sugerencia: Utilice el teorema 6. 

35. Sugerencia: Aplique el teorema 6 y algún otro. 


37. det AB = det 


6 0 
17 4 

(det A)(det 5) = 3 • 8 = 24 


= 24; 


39. a) 212 b ) 500 c) -3 d) \ e) 64 


21. —2, (18 + 12 k) — (20 + 12 k) = —2. Un remplazo de fila 
no cambia el valor de un determinante. 

23. —5, k( 4) — k( 2) + k( — 7) = —5 k. Escalar una fila por una 
constante k multiplica el determinante por k. 

25. 1 27. k 29. -1 


41. det A = (a + e)d — (b + f)c = acl + ed — be — fe 
= ( ad — be) + (ed — fe) = det B + det C 

43. Sugerencia: Calcule det A con desarrollo por cofactores a lo 
largo de la columna 3. 

45. [M] Exprese su conjetura sobre A T A y AA T . 


31. 1. La matriz es triangular superior o inferior, únicamente 
con 1 sobre la diagonal. El determinante es 1, el producto 
de las entradas diagonales. 


33. det EA = det 

= (det E) (det A) 

35. det EA = det 


a + kc 
c 


= cb — ad = (—1 )(ad — be) 


b + kd 
d 
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5/6 

- 1/6 


4 

5/2 


r 5í + 4 

7- í f ±V3; x¡ = 77T ^—— ,a' 2 = 


9. s ^ 0,-1; X\ = 


6 (s 2 - 3)’ 
1 

3 (s + 1) 


, x 2 = 


3/2' 

4 

—7/2 _ 
-As - 15 
4 (s 2 - 3) 
As 4- 3 
6í(s +1) 



= (a + kc)d — 

( b + kd)c 


0 

1 

0" 


1 

_ Q 

0 

1 

0' 


= ad + kcd — 1 

be — kdc = (+ l)(ad — be) 

11. adj A = 

-3 

-1 

-3 

, A~ l 

-3 

-1 

-3 


= (det£)(det A) 


3 

2 

6 _ 



3 

2 

6 _ 

37. 54 = 

" 15 5" 

! 




'-1 

-1 

5“ 


1 

'-1 

-1 

5' 

20 10 

; no 


13. adj A = 

1 

-5 

1 

, A~ l 

1 

-5 

1 







1 

7 

—5 _ 


0 

1 

7 

—5 _ 

41. El área del paralelogramo y el determinante de [u v] son 


2 

0 

0" 


1 

2 

0 

0' 




X 


15. adj A = 

2 

6 

0 

, A~ l 

2 

6 

0 

iguales a 6 . Si v = 

= 

2 

para cualquier x, el área continúa 

-1 

-9 

3 


6 

-1 

-9 

3 


siendo 6. En cada caso no cambia la base del paralelogramo, 
y la altura permanece en 2 porque la segunda coordenada 
de v siempre es 2. 

43. [M] En general. det(A + B) no es igual a det A + det B. 

45. [M] Puede revisar sus conjeturas cuando llegue a la 
sección 3.2. 


17. Si A = 


entonces Cu = d, C 12 = —c, C 21 = —b. 


C 22 = a. La matriz adjunta es la transpuesta de la matriz 
de cofactores: 


adj A = 


d -b 
—c a 



A32 


Respuestas a los ejercicios con numeración impar 


Siguiendo al teorema 8 , divida entre det A; esto produce la 
fórmula de la sección 2 . 2 . 

19. 8 21. 14 23. 22 

25. Una matriz A de 3 x 3 no es invertible si y solo si sus 

columnas son linealmente dependientes (de acuerdo con el 
teorema de la matriz invertible). Esto ocurre si y solo si una 
de las columnas está en el plano generado por las otras dos 
columnas, lo cual es equivalente a la condición de que el 
paralelepípedo determinado por esas columnas tiene volumen 
cero, lo cual, a la vez, equivale a la condición det A = 0. 

27. 24 29. 1 1 det [ Vj v 2 ]| 

31. a) Véase el ejemplo 5. b ) Avabc/3 

33. [M] En MATLAB, las entradas en B — inv(A) son 
aproximadamente 10~ 15 o más pequeñas. 

35. [M] La versión estudiantil 4.0 de MATLAB utiliza 

57,771 flops para inv(A), y 14,269,045 flops para la fórmula 
inversa. El comando inv (A) solamente requiere cerca del 
0.4% de las operaciones para la fórmula inversa. 
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1. a) V 

b ) V 

c) F 

d) F 

e) F 

/) F 

g ) v 

h ) V 

i) F 

í) F 

k) V 

D F 

m) F 

n) V 

0 ) F 

P ) v 




La solución del ejercicio 3 se basa en el hecho de que si una matriz 
contiene dos filas (o dos columnas) que son múltiplos entre sí, 
entonces, de acuerdo con el teorema 4, el determinante de la 
matriz es cero, ya que la matriz no puede ser invertible. 


3. Realice dos operaciones de remplazo de filas, y después 
factorice un múltiplo común en las filas 2 y 3. 


1 a b + c 

1 b a + c 

1 c a + b 


1 a 
0 b — a 

0 c — a 


= (b — a)(c — a) 


b + c 
a — b 
a — c 

1 a b + c 
0 1 -1 

0 1 -1 


5. -12 


7. Cuando el determinante se desarrolle por cofactores de la 
primera fila, la ecuación tiene la forma ax + by + c — 0 , 
donde al menos a o ó no valen cero. Esta es la ecuación de 
una recta. Es claro que (x\, y\) y (* 2 , y 2 ) están sobre la recta, 
porque cuando las coordenadas de uno de los puntos se 
sustituyen por x y y, dos filas de la matriz son iguales y, 
de esta forma, el determinante es cero. 


9. T 


11 


1 a a 2 

0 b — a b 2 — a 2 


. Así, de acuerdo con el 


teorema 3, 


' 1 

a 

a 2 


det T = (b — a)(c — 

a) det 

0 

1 

b + a 




0 

1 

c + a 




' 1 

a 

a 2 " 


= (b — a)(c — 

a) det 

0 

1 

b + a 




0 

0 

c — b 


1 

O 

1 

II 

a)(c - 

b) 




Área = 12. Si se resta un vértice de los cuatro vértices, y si los 

nuevos vértices son 0 

> vi, v 2 y V 3 , entonces la figura trasladada 


(y por lo tanto, la figura original) será un paralelogramo si y 
solo si uno de los vectores Vi, V 2 y V 3 es la suma de los otros 
dos vectores. 


13. Según la fórmula inversa, (adj A) • 


1 


det A 


-A = A~‘A = I. 


Según el teorema de la matriz invertida, adj A es invertible 

y(,d > Ar ' = ¿Á A - 

15. a) X = CA 1 . Y = D — CA l B. Ahora utilice el ejercicio 
14c). 

b ) A partir del inciso a), y de la propiedad multiplicativa 
de los determinantes, 


det 


A 

C 


B 

D 


= det [ A(D - CA~ l B) ] 

= det [ AD — ACA~ l B ] 

= det [ AD — CAA~ l B ] 

= det [ AD — CB ] 

donde la igualdad AC = CA se aplicó en el tercer paso. 

17. Primero considere el caso n = 2, y demuestre que el resultado 
es válido mediante cálculo directo de los determinantes de B 
y C. Ahora, suponga que la fórmula es válida para todas las 
matrices (k — 1) x (k — 1), y sean A, By C matrices de kxk. 
Utilice un desarrollo por factores a lo largo la primera columna 
y la hipótesis inductiva para obtener det B. En C aplique 
operaciones de remplazo de filas para generar ceros debajo 
del primer pivote y así producir una matriz triangular. 
Encuentre el determinante de esta matriz y súmelo a det B 
para obtener el resultado. 

19. [M] Calcule: 


1 1 
1 2 
1 2 

1 1 
1 2 
1 2 
1 2 
1 2 



1 

1 

1 

1 

= 1, 

1 

2 

2 

2 

1 

2 

3 

3 


1 

2 

3 

4 


= 1, 


= 1 



Respuestas a los ejercicios con numeración impar A33 


Suposición: 

1 1 1 ... 1 
12 2 2 

12 3 3 


| 1 2 3 ... n | 

Para confirmar la suposición, utilice operaciones de remplazo 
de filas para generar ceros bajo el primer pivote, después bajo 
el segundo pivote, y así sucesivamente. La matriz resultante es 

1 1 1 ... 1 
0 11 1 

0 0 1 1 


|0 0 0 ... 1 I 

que es una matriz triangular superior con determinante 1. 


21. Sí. Evidentemente, se satisfacen las condiciones para un 

subespacio: la matriz cero está en H, la suma de dos matrices 
triangulares superiores es triangular superior, y cualquier 
múltiplo escalar de una matriz triangular superior es otra vez 
triangular superior. 

25. 4 27. a) 8 b) 3 c) 5 d) 4 

29. u+(—l)u = lu+(— l)u Axioma 10 
= [1 + (— l)]u Axioma 8 
= Ou = 0 Ejercicio 27 

Del ejercicio 26, se deduce que ( — l)u = — u. 

31. Cualquier subespacio H que contiene a u y v también debe 
contener todos los múltiplos escalares de u y v; por lo tanto, 
debe contener todas las sumas de los múltiplos escalares de 
u y de v. Por consiguiente, H debe contener a Gen {u, vj. 


Capítulo 4 

Sección 4.1, página 195 

1. a) u + v está en V porque sus entradas son no negativas. 


b) Ejemplo: 


3. Ejemplo 


cu no está en H. 


pío: Si u = “ 

pero cu no está en V. 

v r- s i 

: Si u = ^ y < 


y c = — 1, entonces u está en V, 


y c = 4, entonces u está en H, pero 


5. Sí, de acuerdo con el teorema 1, porque el conjunto es 
Gen {f 2 }. 

7. No, el conjunto no es cerrado bajo multiplicación por escalares 
que no sean enteros. 


9. H = Gen {v}, donde v = 5 . Según el teorema 1, H es 

3_ 

un subespacio de IR 3 . 


11. W = Gen {u, v}, donde u = — 1 , v = 0 . Según el 


teorema 1, W es un subespacio de IR 3 . 

13. a) Solo existen tres vectores en {vi, V 2 , V 3 }, y w no es uno 
de ellos. 

b) Hay una infinidad de vectores en Gen (vi, V 2 , V 3 j. 

c) w está en Gen {vi, V 2 , V 3 j porque w = v¡ + V 2 . 

15. W no es un espacio vectorial porque el vector cero no está 
en W. 


17. S = 


19. Sugerencia: Utilice el teorema 1. 


33. Sugerencia: Para una parte de la solución, considere wi y 
W 2 en H + K, y escriba wi y W 2 en la forma wi = ui + vi 
y W 2 = U 2 + V 2 , donde u¡ y U 2 están en El, y vi y V 2 están 
en K. 

35. [M] La forma escalonada reducida de [vi, V 2 , V 3 , w] muestra 
que w = vi — 2v 2 + V 3 . Por lo tanto, w está en el subespacio 
generado por vi, V 2 y V 3 . 

37. [M] Las funciones son cos(4f) y cos(6í). Véase el ejercicio 34 
de la sección 4.5. 
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de manera que w está en Nul A. 



7. W no es un subespacio de IR 3 ya que el vector cero (0, 0, 0) 
no está en W. 

9. W es un subespacio de IR 4 porque W es el conjunto de 
soluciones del sistema 

p — 3q — 4s =0 
2 p — s — 5r = 0 

11. W no es un subespacio porque 0 no está en W. Justificación: Si 
un elemento típico (i — 2t, 3 + 3s, 3s + t, 2s) fuera cero, 
entonces 3 + 3í = 0 y 2s = 0, lo que es imposible. 



A34 Respuestas a los ejercicios con numeración impar 


1 -6 

13. W = Col A para A = 0 1 , así que W es un espacio 

|_ 1 o j 

vectorial, de acuerdo con el teorema 3. 


0 2 1 

1 -1 2 

3 1 0 

2 -1 -1 


17. a) 2 b) 4 


19. a) 5 b) 2 


21. El vector 


" 2 " 

3 j esta 


en Nul A y el vector está en Col A. 


Son posibles otras respuestas. 


23. w está tanto en Nul A como en Col A. 


3 1-3-3 

27. Sean x = 2 y A = —2 4 2 . Así, x está en 

_-iJ [-1 5 7 _ 

Nul A, y como este es un subespacio de IR 3 , entonces lOx 
se encuentra en Nul A. 


29. a) AO = 0. por lo que el vector cero está en Col A. 

b ) Por una propiedad de la multiplicación matricial, 

Ax + Aw = A(x + w), lo que indica que Ax + Aw es 
una combinación lineal de las columnas de A y, por 
lo tanto, está en Col A. 

c) c(Ax) = A(cx), lo que muestra que c(Ax) se encuentra 
en Col A para todos los escalares c. 

31. a) Para polinomios arbitrarios p, q en Pi y cualquier escalar c, 

T(n , -V _ \ (p + q)(0) 1 _ I" PÍO) + q(0)" 

,P + q,_ LtP + qHDj ~ Lp(!) + q(!)_ 

= pío ] + [ «¡a! ] = r<p) + 7 ’ <q) 

7 ' (í ' P) = _ep<l)] “‘[pío] =í,r,P) 

Así, T es una transformación lineal de Pt en P 2 . 

b) Cualquier polinomio cuadrático que se anula en 0 y 1 debe 
ser múltiplo de p(r) = t(t — 1). El rango de T es IR 2 . 

33. a) Para A, B en M 2 X 2 y cualquier escalar c, 

T(A + B) = (A + B) + {A + B) t 

= A + B + A T + B T Propiedad de la transpuesta 
= (A + A T ) + (B + B T ) = T (A) + T(B) 

T(cA ) = (cA) + (cA) T =cA + cA T 
= c(A + A T ) = cT(A ) 

Así, T es una transformación lineal de M 2 Y .2 en AÍ 2 x 2 . 

b) Si B es cualquier elemento en M 2 X 2 con la propiedad 
B T = B, y si A = B, entonces, 

T(A) = \B+ (\B) T = \B + \B = B 


c) El inciso b) demostró que el rango de T contiene todas 
las B tales que B T = B. Así, es suficiente demostrar 
que cualquier B en el rango de T tiene esta propiedad. 

Si B = T(A), entonces, de acuerdo con las propiedades 
de las transpuestas, 

B t = (A + A t ) t = A t + A tt = A t + A = B 

d ) El núcleo de T es j ^ ^ : b real 

35. Sugerencia: Compruebe las tres condiciones para un 
subespacio. Elementos típicos de T(U) tienen la forma 
r(m) y E(u 2 ), donde Ui, U 2 están en U. 

37. [M] w está en Col A, pero no en Nul A. (Explique por qué). 

39. [M] La forma escalonada reducida de A es 

'1 0 1/3 0 10/3 “ 

0 1 1/3 0 -26/3 

0 0 0 1 -4 

0 0 0 0 0 
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1 1 1 ' 

0 11 tiene tres posiciones 

0 0 1 J 

pivote. De acuerdo con el teorema de la matriz invertible, 

A es invertible y sus columnas forman una base para IR 3 . 
(Véase el ejemplo 3). 

3. Este conjunto no forma una base para IR 3 . El conjunto es 
linealmente dependiente y no genera IR 3 . 

5. Este conjunto no forma una base para IR 3 . El conjunto es 
linealmente dependiente porque el vector cero está en el 
conjunto. Sin embargo, 


3 

-3 

0 

0 

' 1 

-1 

0 

0' 

-3 

7 

0 

-3 ~ 

- 0 

4 

0 

-3 

0 

0 

0 

5 

0 

0 

0 

5 


La matriz tiene un pivote en cada fila y, por lo tanto, sus 
columnas generan IR 3 . 


1. La matriz de 3 x 3 A = 


7. Este conjunto no forma una base para IR 3 . El conjunto es 

linealmente independiente porque un vector no es un múltiplo 
del otro. Sin embargo, los vectores no generan IR 3 . La matriz 
'-2 6 ' 

3 — 1 puede tener a lo sumo dos pivotes ya que solo tiene 

° 5 J 

dos columnas. Por lo tanto, no habrá un pivote en cada fila. 



13. Base para Nul A: 




Base para Col A: 





Respuestas a los ejercicios con numeración impar A35 


15. {vi, v 2 , v 4 , v 5 J 17. [M] ¡vi, v 2 , v 3 , v 5 } 

19. Las tres respuestas más sencillas son {vi, Vt}. {vi, V 3 } y 
{V 2 . V 3 }. Son posibles otras respuestas. 

23. Sugerencia: Utilice el teorema de matriz invertible. 

25. No. (¿Por qué el conjunto no es una base para Hl). 

27. {eos ai t, sen cot j 

29. Sea A la matriz de n x k\v¡ ■■■ vj. Como A tiene menos 
columnas que filas, entonces no puede existir una posición 
pivote en cada fila de A. De acuerdo con el teorema 4 de la 
sección 1.4, las columnas de A no generan IR" y, por lo tanto, 
no son una base para IR". 

31. Sugerencia: Si {vi,..., v^} es linealmente dependiente, 
entonces existen ci,..., c p , no todos cero, tales que 
C 1 V 1 + ••• + c p \ p = 0. Utilice esta ecuación. 

33. Ningún polinomio es un múltiplo del otro polinomio, de manera 
que {pi, P 2 } es un conjunto linealmente independiente en P 3 . 

35. Sea ¡Vi, V 3 } cualquier conjunto linealmente independiente 
en el espacio vectorial V, y sean V 2 y V 4 una combinación 
lineal de y V 3 . Entonces, {vi, V 3 } es una base para 
Gen {vi, V 2 , V 3 , v 4 ). 

37. [M] Hay que ser hábil para encontrar valores especiales de t 
que den varios ceros en (5), y después crear un sistema 
de ecuaciones que se pueda resolver fácilmente a mano. 

O bien, se podrían usar valores de t tales como t = 0 , . 1 , . 2 ,... 
para crear un sistema de ecuaciones que pueda resolverse 
con un programa de matrices. 
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(un número infinito de respuestas) 


19. Sugerencia: Por hipótesis, el vector cero tiene una única 
representación como una combinación lineal de elementos 
de S. 



23. Sugerencia: Suponga que [u]e = [w]g para algunas u y w 
en V, y denote las entradas en [u]g como ci,..., c„. Utilice 
la definición de [u]g. 

25. Un posible método: Primero, demuestre que si Ui,..., son 
linealmente dependientes , entonces [uóg,..., [u^jg son lineal¬ 
mente dependientes. Segundo, demuestre que si [ui]g,..., [u p ]g 
son linealmente dependientes, entonces ut v .., u p son lineal¬ 
mente dependientes. Utilice las dos ecuaciones que se 
presentan en el ejercicio. 


27. Linealmente independiente. (Justifique las respuestas a los 
ejercicios 27 a 34). 

29. Linealmente dependiente. 


31. a) Los vectores de coordenadas —3 

5 


0 no generan IR 3 . Debido al isomorfismo entre 
- 1 _ 

IR 3 y P 2 , los polinomios correspondientes no generan P 2 . 


b) Los vectores de coordenadas 5,-8, 4 , - 

1 J [_ —2 J [_ 2 J 

generan IR 3 . Debido al isomorfismo entre IR 3 y P 2 , los 
polinomios correspondientes generan P 2 . 


33. [M] Los vectores de coordenadas 


son un subconjunto linealmente dependiente de IR 4 . 


Debido al isomorfismo entre IR 4 y P 3 , los polinomios corres¬ 
pondientes forman un subconjunto linealmente dependiente 
de P 3 y, por lo tanto, no forman una base para P 3 . 


35. [M] [x] B = 


'-5/3" 

8/3 _ 


1.3 

37. [M] 0 
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L-3J L oj L 6 j 


7. No hay base; dim es 0 9. 2 11. 3 13. 2,3 

15. 2,3 17. 0,3 

21. Sugerencia: Solo se necesita demostrar que los primeros 

cuatro polinomios de Hermite son linealmente independientes. 
¿Por qué? 

23. [p]g = (3, 6, 2, 1) 

25. Sugerencia: Suponga que S genera V , y utilice el teorema 
del conjunto generador. Esto conduce a una contradicción, 
lo que demuestra que es falsa la hipótesis de generación. 



A36 Respuestas a los ejercicios con numeración impar 


27. Sugerencia: Considere el hecho de que cada P„ es un 
subespacio de P. 

29. Justifique cada respuesta: 

a) Verdadero b) Verdadero c) Verdadero 

31. Sugerencia: Como H es un subespacio diferente de cero 

de un espacio de dimensión finita, entonces H también es de 
dimensión finita y tiene una base, por ejemplo, vi ,..\ p - 
Primero demuestre que {7"(vi),..., Plv^,)} genera T(H). 

33. [M] a) Una base es {vi, V 2 , V3, e 2 , e 3 j. De hecho, cualesquiera 
dos de los vectores e2,..., extenderá {vi, V 2 , V 3 } a una 
base de IR 5 . 
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25. No. Explique por qué. 

27. Fil A y Nul A están en IR"; Col A y Nul A T están en IR"'. 

Solo hay cuatro subespacios distintos porque Fil A T = Col A 
y Col A r = Fil A. 

29. Recuerde que dim Col A = m precisamente cuando 

Col A = IR m o, de manera equivalente, cuando la ecuación 
Ax — b es consistente para toda b. De acuerdo con el 
ejercicio 28¿>), dim Col A = m precisamente cuando 
dim Nul A T = 0 o, de manera equivalente, cuando la 
ecuación A T x = 0 solo tiene la solución trivial. 

2 a 2b 2c 

31. uv r = —3 a —3b —3c . Todas las columnas son 

5a 5b 5c _ 


1. rango A = 2; dim Nul A = 2; 

ll [-4 

Base para Col A: — 1 , 2 

5 J L ~ 6 

Base para Fil A: (1,0, -1,5), (0, -2,5, -6) 


Base para Nul A: 




múltiplos de u, de manera que Col uv T es unidimensional, 
a menos que a = b = c = 0. 

33. Sugerencia: Sea A = [u 112 113 ]. Si 11 A 0. entonces u 
es una base para Col A. ¿Por qué? 

35. [M] Sugerencia: Véase el ejercicio 28 y las observaciones 
antes del ejemplo 4. 

37. [M] Las matrices C y R para el ejercicio 35 funcionan aquí, 
yA = CR. 


3. rango A = 3; dim Nul A = 3; 
Base para Col A: 


Base para Nul A: (2, 6, -6, 6,3,6), (0, 3, 0, 3, 3, 0), 
(0, 0, 0, 0, 3, 0) 


Base para Fil A: 


5. 4,3,3 

7. Sí; no. Como Col A es un subespacio de dimensión 4 de IR 4 , 
entonces coincide con IR 4 . El espacio nulo no puede ser IR 3 , 
porque los vectores en Nul A tienen 7 entradas. Nul A es un 
subespacio tridimensional de IR 7 , de acuerdo con el teorema 
del rango. 

9. 3, no. Observe que las columnas de una matriz de 4 x 6 están en 
IR 4 , más que en IR 3 . Col A es un subespacio tridimensional de IR 4 . 

11 . 2 

13. 5, 5. En ambos casos, el número de pivotes no puede exceder 
el número de columnas o el número de filas. 

15. 4 

19. Sí. Intente escribir una explicación. 

21. No. Explique por qué. 

23. Sí. Solo se necesitan seis ecuaciones lineales homogéneas. 
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13 p — 

AJ * C^B ~ 

1 

-2 

3 

-5 

0' 

2 

, [—1 + 2 ?]b = 

5' 

-2 


1 

4 

3 


1 


15. a ) B es una base para V. 

b ) El mapeo de coordenadas es una transformación lineal. 

c) El producto de una matriz y un vector. 

d) El vector de coordenadas de v respecto de B. 


17. a) [M] 



0 

16 

0 

12 

0 

10 

32 

0 

24 

0 

20 

0 


16 

0 

16 

0 

15 



8 

0 

10 

0 




4 

0 

6 


2 0 
1 _ 



Respuestas a los ejercicios con numeración impar A37 


b) eos 2 t = (1/2)[1 + cos2í] 
eos 3 1 = (1 /4) [3 eos t + eos 3/] 
cos 4 í = (l/8)[3 + 4cos2? + cos4?[ 
eos 5 1 = (1/16) [10 eos t + 5 eos 3 1 + eos 5?] 
cos 6 í = (1/32) [10 + 15 eos 2? + 6 eos 4? + cosóí] 


19. [M] Sugerencia: Sea C la base {vi, v 2 , V3}. Entonces las 
columnas de P son [lije, [u 2 ]c y [U 3 ]e- Utilice la definición 
de vectores de C-coordenadas y álgebra matricial para 
calcular Ui, u 2 , U3. A continuación se presentan las respuestas 
numéricas: 


a) ui = 

'-6" 

-5 

, u 2 = 

"-6“ 

-9 

, u 3 = 

1 - 

fn 0 

1 

i_ 


21 


32 


L 3J 


b) Wi = 

' 28" 

-9 

, W2 = 

38" 

-13 

, W3 = 

" 21 " 

-7 


-3 


2 


3 


entonces las señales forman una base para H, de acuerdo con el 
teorema de la base. 

7. Sí 9. Sí 

11. No, dos señales no pueden generar el espacio solución 
tridimensional. 

13. (f)\(f)* 15. (£)*,(-§)* 

17. Y k = ci(.8)* + c 2 (.5) k + 10 -*■ 10 conforme k —> 00 

19. y k = c¡ (-2 + s/3) k + c 2 (—2 - V3) k 

21. 7, 5, 4, 3, 4, 5, 6, 6, 7, 8, 9, 8, 7; véase la figura: 


10 + 
8 - 
6 - 
4 -- 
2 -- 


0 


- datos originales 

- datos suavizados 


10 


12 


—|— k 
14 
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1. Si y k = 2 a , entonces y k+1 = 2 A+1 y y* +2 = 2 A+2 . 

Al sustituir estas fórmulas en el lado izquierdo de la ecuación 
se obtiene 

yk +2 + 2 y k+l - 8 y k = 2 k+1 + 2 ■ 2 k+l - 8 • 2 k 
= 2 A (2 2 + 2 • 2 — 8) 

= 2 a (0) = 0 para toda k 

Puesto que la ecuación en diferencias es válida para toda k , 
entonces 2 a es una solución. Un cálculo similar funciona 
para » = (-4) A . 

3. Las señales 2 a y (—4) A son linealmente independientes 

porque ninguna es múltiplo de la otra. Por ejemplo, no existe 
un escalar c tal que 2 a = c(—4) A para toda k. De acuerdo 
con el teorema 17, el conjunto solución H de la ecuación 
en diferencias del ejercicio 1 es bidimensional. De acuerdo 
con el teorema de la base de la sección 4.5, las dos señales 
linealmente independientes 2 a y (—4) A forman una base 
para H. 

5. Si y k = ( —2) A , entonces 

y k+2 + 4y* +1 -f 4 y k = (-2) A + 2 + 4(-2) A+1 + 4(-2) A 
= (—2)* [(—2) 2 + 4 (—2) + 4] 

= (—2) a (0) = 0 para toda k 
De manera similar, si y k = k(— 2) A , entonces 
yk +2 + 44 * 4-1 + 4y k 

= (k + 2)(-2) a+2 + 4 (k + 1)(-2) A+1 + 4A'(—2) A 
= (-2 ) k [(k + 2)(—2) 2 + 4 (k + 1) (—2) + 4 k\ 

= (-2) a [4 k + 8 - Sk - 8 + 4Ar] 

= (—2) A (0) para toda k 

Así, (—2) A y k{ — 2) a están en el espacio solución H de la 
ecuación en diferencias. Además, no existe escalar c tal que 
k(—2) k = c(—2) k para toda k, porque c se debe seleccionar 
independientemente de k. De igual manera, no existe un 
escalar c tal que ( —2) A = ck( — 2) A para toda k. Así, ambas 
señales son linealmente independientes. Como dim H = 2, 


23. a) y k +\ — l.Oly* = —450, y 0 = 10,000 

25. k 2 + Cl - (—4) A + c 2 27. -2 + k + d- 2 k + c 2 • (-2) A 

29. x* + i = Ax k , donde 


A = 

"0100“ 
0 0 10 

, X = 

yk 

yk+ 1 


0 0 0 1 


yk+2 


2-6 8-3 


_ y k +3 _ 


31. La ecuación es válida para toda k, así que esta vale para k — I 
en lugar de k, lo que transforma la ecuación en 

yk+2 + 5.V(r+t + 6» = 0 para toda k 
La ecuación es de orden 2. 

33. Para toda k, la matriz de Casorati C(k) no es invertible. 

En este caso, la matriz de Casorati no da información acerca 
de la independencia o dependencia lineal del conjunto de 
señales. De hecho, ninguna señal es un múltiplo de la otra, 
así que son linealmente independientes. 

35. Sugerencia: Compruebe las dos propiedades que definen 
una transformación lineal. Para [y¿} y {z¿-} en S, estudie 
T({y k } + ÍZjt))- Observe que si r es cualquier escalar, 
entonces el L-ésimo término de r{y k ] es ry k , así, T(r[y k }) 
es la secuencia {w*} dada por 

Wk = ry k+2 + a(ry k+i ) + b(ry k ) 

37. Sugerencia: Encuentre TD(y o, vi, >' 2 ,...) y DT(yo, yt, y 2 ,.. .). 


Sección 4.9, página 260 


1 . a) 


3. a) 


De: 


N 

M 


A: 

'.7 

.6 


Noticias 

.3 

.4 


Música 

De: 



H 


I 

A: 

.95 

.45' 

Sano 

.05 

.55 

Enfermo 



c) 33% 


b) 15%, 12.5% 



A38 Respuestas a los ejercicios con numeración impar 



9. Sí, porque todas las entradas de P 2 son positivas. 

11. a) ^ b) 2/3 

13. a) j b) .10, no 

15. [M] Aproximadamente el 13.9% de la población de Estados 
Unidos. 

17. a) Las entradas en una columna de P suman 1. Una columna 
en la matriz P — I tiene las mismas entradas que en P 
excepto que una de las entradas ha disminuido en 1. 

Por lo tanto, la suma de cada columna es 0. 

b) De acuerdo con el inciso a), la fila inferior de P — I es el 
negativo de la suma de las otras filas. 

c) Según el inciso tí) y el teorema del conjunto generador, 
la fila inferior de P — 1 se puede eliminar y las restantes 
(n — 1) filas continuarán generando el espacio fila. 

De forma alternativa, utilice el inciso a ) y considere el 
hecho de que las operaciones fila no cambian el espacio 
fila. Sea A la matriz obtenida de P — 1 sumando la fila 
inferior a todas las demás filas. Según el inciso a), el 
espacio fila se genera por las primeras (n — I) filas de A. 

d) De acuerdo con el teorema del rango y el inciso c), la 
dimensión del espacio columna de P — I es menor que n, 
y así el espacio nulo es no trivial. En vez del teorema del 
rango, se puede recurrir al teorema de la matriz invertida, 
ya que P — le s una matriz cuadrada. 

19. a) El producto Sx es igual a la suma de las entradas en x. 
Para un vector de probabilidad, esta suma debe ser 1. 

b) P = [pi P 2 — p„], donde las p, son vectores de 
probabilidad. Mediante la multiplicación matricial 
y el inciso a), 

SP = [S Pl Sp 2 ••• Sp„] = [l 1 ••• l] = 5 

c) Por el inciso tí), S(Px) = (SP)x = Sx = 1. También, 

las entradas en Px son no negativas (porque P y x tienen 
entradas no negativas). Así, por el inciso a), Px es un 
vector de probabilidad. 


Capítulo 4 Ejercicios complementarios, página 262 


1. a) V 

b) V 

c) F 

d) F 

e) V 

/) v 

g) F 

h) F 

i) V 

í) F 

k) F 

/) F 

ni) V 

n) F 

0 ) V 

p) V 

q) F 

r) V 

s) V 

t) F 






3. El conjunto de todas las (bu ¿>2, b-¡) que satisfacen 

b\ + 2 fe 2 T Ó 3 = 0 . 

5. El vector pi no es cero y P2 no es un múltiplo de pi, de ma¬ 
nera que conserve ambos vectores. Como P3 = 2pi + 2p 2 , 
elimine P 3 . Ya que P 4 tiene un término í 2 , no puede ser 
una combinación lineal de pi y p 2 , entonces conserve P4. 
Finalmente, Ps = Pi + P4, entonces elimine P5. 

La base resultante es {pi, p 2 , P4). 


7. Se debería saber que el conjunto solución del sistema 
homogéneo se genera con dos soluciones. En este caso, 
el espacio nulo de la matriz de coeficientes A de18 x 20, 
a lo sumo, es bidimensional. De acuerdo con el teorema 
del rango, dim Col A a 20 — 2 = 18, lo que significa que 
Col A = IR 18 , porque A tiene 18 filas, y cada ecuación 
Ax = b es consistente. 

9. Sea A la matriz estándar de m x n de la transformación T. 

a ) Si T es uno a uno, entonces las columnas de A son 
linealmente independientes (teorema 12 de la sección 1.9), 
por lo que dim Nul A = 0. De acuerdo con el teorema del 
rango, dim Col A = rango A = n. Como el rango de T es 
Col A, la dimensión del rango de T es n. 

b) Si T es sobre, entonces las columnas de A generan IR"' 
(teorema 12 de la sección 1.9), de manera 

que dim Col A = m. Según el teorema del rango, 
dim Nul A = n — dim Col A = n — m. Como el 
núcleo de T es Nul A, la dimensión del núcleo de 
T es n — m. 

11. Si S es un conjunto generador finito para V, entonces 

un subconjunto de S (por ejemplo, 5') es una base para V. 
Como S' debe generar a V , S' no puede ser un subconjunto 
propio de S debido a la minimalidad de S. Por lo tanto, 

S' = S, lo que demuestra que S es una base para V. 

12. a) Sugerencia: Cualquier y en Col AB tiene la forma y = ABx 

para alguna x. 

13. De acuerdo con el ejercicio 9, rango PA :£ rango A, 
y rango A = rango P~ l PA £ rango PA. Por lo tanto, 
rango PA = rango A. 

15. La ecuación AB = 0 indica que cada columna de B está 
en Nul A. Como Nul A es un subespacio, entonces todas 
las combinaciones lineales de las columnas de B están en 
Nul A, de manera que Col B es un subespacio de Nul A. Según 
el teorema 11 de la sección 4.5, dim Col B £ dim Nul A. 

Al aplicar el teorema del rango, se encuentra que 

N = rango A + dim Nul A S rango A + rango B 

17. a) Suponga que A\ consiste en las r columnas pivote en A. 

Las columnas de A] son linealmente independientes. 

Así, Ai es una submatriz de m x r con rango r. 
b ) De acuerdo con el teorema del rango aplicado a Ai, 
la dimensión de Fil A es r, de manera que Ai tiene r 
filas linealmente independientes. Utilícelas para formar 
A 2 . Entonces, A 2 es de r x r con filas linealmente 
independientes. Según el teorema de la matriz invertida, 

A 2 es invertible. 

'0 1 0' 

19. [B AB A 2 B]= 1 -.9 .81 

L 1 * - 5 - 25 _ 

1 -.9 .81' 

0 1 0 

0 0 -.56 _ 

Esta matriz tiene rango 3, así que el par (A, B) es controlable. 

21. [M] rango [B AB A 2 B A 3 B] = 3. El par (A, B) no es 
controlable. 
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Capítulo 5 

Sección 5.1, página 271 

1. Sí 3. Sí, A = -2 5. Sí, A = -5 



19. 0. Justifique su respuesta. 



Sección 5.2, página 279 

1. A 2 - 4A - 45; 9, -5 3. A 2 - 3A - 40;-5, 8 

5. A 2 - 16A + 48; 4, 12 
7. A 2 — 9A + 32; ningún valor propio real 
9. -A 3 + 10A 2 - 33A + 36 11. -A 3 + 8A 2 - 19A + 12 

13. -A 3 + 18A 2 - 95A + 150 15. 2, 3, 5, 5 

17. 3, 3, 1, 1,0 

19. Sugerencia: La ecuación dada es válida para toda A. 


23. Sugerencia: Aplique el teorema 2. 

25. Sugerencia: Utilice la ecuación Ax = Ax para encontrar una 
ecuación que implique a A~*. 

27. Sugerencia: Para cualquier A, (A — A 1) T — A T — A/. 

De acuerdo con un teorema (¿cuál?), A r — A 1 es invertible 
si y solo si A — A/ es invertible. 

29. Sea v el vector en IR" con todas sus entradas igual a 1. 
Entonces, Av = sx. 

31. Sugerencia: Si A es la matriz estándar de T, busque un vector v 
diferente de cero (un punto en el plano) tal que Av = v. 

33. a) Xk+i = ciX k+l u + c 2 fi k+l \ 

b) Axk = A(c l X k u + c 2 ¡M k x) 

= C\X k Au + c 2 \i k Ax Linealidad 
= ciA^Au + c 2 ¡i k ¡ix u y v son vectores propios. 

= 



23. Sugerencia: Encuentre una matriz invertible P tal que 
RQ = P l AP. 

25. a) {vi, v 2 }, donde v 2 = j es un vector propio para 
A = .3 

b) Xo = V! - ¿v 2 

c) x¡ = V! - ¿(,3)v 2 ,x 2 = V! - pj(.3) 2 v 2 y 

xr = Vi — ±(.3) k v 2 . As k 00 , (.3)* 0 y 

x k -»• Vi. 

27. a) Avi = Vi, Av 2 = ,5v 2 , AV 3 = . 2 v 3 (Esto también muestra 
que los valores propios de A son 1, .5 y .2). 

b ) {vi, v 2 , V 3 } es linealmente independiente porque los 
vectores propios corresponden a distintos valores propios 
(teorema 2). Como hay 3 vectores en el conjunto, entonces 
el conjunto es una base para IR 3 . Así, existen constantes 
(únicas) tales que 

X 0 = C 1 V 1 + C 2 V 2 + C 3 V 3 

Entonces, 

WX 0 = ClW r Vl + C 2 W r V 2 + C 3 W r V 3 (*) 

Como xo y Vi son vectores de probabilidad y puesto 
que las entradas en v 2 y en V 3 suman 0, (*) indica que 
1 = C|. 

c) De acuerdo con el inciso b), 

X 0 = Vi + C 2 V 2 + C 3 V 3 
Con base en el inciso a), 

x k = A^xo = A^vi + c 2 A k x 2 + c 2 A k y 2 , 

= Vi + £¿>(.5)^2 + c 3 (-2) A: V3 
—> Vi como k —*■ 00 
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29. [M] Informe sus resultados y conclusiones. 

Sección 5.3, página 286 


"226 

-525" 

3. 

" a k 

0 " 

90 

-209 

2 {a k -b k ) 

b k _ 



'-1 " 

1 

1 ' 


0 ' 

5. A = 2: 

1 

en 

II 

«-< 

-1 

, 

-1 


-1 


0 


1 


35. [M] P = 


D = 


1 

0 

0 

0 

o 


2 

1 

0 

o 

o 

o 

7 

0 

o 

o 


1 

o 

1 

1 

o 

o 

o 

7 

0 

o 


—3 1 0' 

0 1 0 
o 0-1 
o 1 o 
2 0 1 _ 

0 0 ' 

0 0 

0 o 

-14 0 

0 -14 


Cuando una respuesta implica una diagonalización, A = PDP 1 , 
los factores P y D no son únicos, de manera que su respuesta tal 
vez difiera de la que aquí se presenta. 


7. 



D = 


0 

-1 


9. No es diagonalizable 



' 1 

-1 

- 1 " 


'5 

0 

0' 

11 . p = 

2 

1 

0 

, D = 

0 

-1 

0 


3 

0 

1 


0 

0 

-1 



'-1 

2 

1' 


'5 

0 

0' 

13. P = 

-1 

-1 

0 

, D = 

0 

1 

0 


1 

0 

1 


0 

0 

1 


'-1 

-1 

-1' 


'0 

0 

0' 

15. P = 

1 

1 

0 

, D = 

0 

1 

0 


-1 

0 

1 


0 

0 

1 


17. No es diagonalizable 


' 1 

3 

-1 

-1' 


'5 

0 

0 

0' 

0 

2 

-1 

2 

, D = 

0 

3 

0 

0 

0 

0 

1 

0 

0 

0 

2 

0 

0 

0 

0 

1 


0 

0 

0 

2 


Sección 5.4, página 293 



0 

4 


3. a) T(ei) = b 3 , T(e 2 ) = -b! - 2b 2 , jT(e 3 ) = 2b¡ + 3b 3 


b) [7Xe,)] B 
[7Xe 3 )] B 


0 

0 

1 

2 

0 

3 


me 2 )] B 



c) 


-1 

-2 

0 


2 

0 

3 


5. a) 9 — 3t + t 2 + t 3 


b ) Para cualesquiera p, q en P 2 y cualquier escalar c. 


r[p(í) + q(0] = (t + 3)[p(f) + q(í)] 

= (t + 3)p(í) + (t + 3)q(í) 

= r[p(í)] + r[q(r)] 

r[c-p(r)] = (t + 3) [c - p(í )] = c-(t + 3)p(r) 

= c-r[p(f)] 


23. Sí. (Explique por qué). 


25. No, A debe ser diagonalizable. (Explique por qué). 

27. Sugerencia: Escriba A = PDP 1 . Como A es invertible, 
0 no es un valor propio de A, de manera que D tiene 
entradas diferentes de cero sobre su diagonal. 


29. Una respuesta es P¡ 



1 , cuyas columnas 


son vectores propios correspondientes a los valores 
propios en D¡. 


3 

1 

0 

0 


0 0 
3 0 

1 3 

0 1 


7. 


3 0 
5 -2 

0 4 


0 

0 

1 


9. a ) 


2 

5 

8 


31. Sugerencia: Construya una adecuada matriz triangular 
de 2 x 2. 


[M] P = 


-12 000 

0-12 0 0 
0 0 13 0 

0 0 0 13 


b ) Sugerencia: Calcule 7T p + q) y Tic ■ p) para p, q 
arbitrarios en P 2 y cualquier escalar c. 


'2 

0 

-1 

1 ■ 


' 1 

-1 

1 - 

7 

-1 

0 

-4 

c) 

1 

0 

0 

7 

0 

2 

0 


1 

1 

1 

0 

1 

0 

3 






11 . 


15. b, = 


b 2 — 


13. b, = 


-1 

3 


b 2 = 


D = 
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17. a) Ab¡ = 3bi, por lo que bi es un vector propio de A. 
Sin embargo, A solo tiene un valor propio, A = 3, 
y el espacio propio es unidimensional, por lo que A 
no es diagonalizable. 


19. Por definición. Si A es semejante a B, existe una matriz 
invertible P tal que P~ l AP = B. (Véase la sección 5.2). 
Entonces, B es invertible porque es el producto de matrices 
invertibles. Utilice la ecuación P~ 1 AP = B para demostrar 
que A -1 es semejante a B 1 . 

21. Sugerencia: Revise el problema de práctica 2. 

23. Sugerencia: Calcule B(P~ l x). 

25. Sugerencia: Escriba A = PBP 1 = (PB)P^ 1 , y utilice la 
propiedad de la traza. 

27. Para cada y, /(b/) = b Como el vector de coordenadas 
estándar de cualquier vector en IR" es justamente el vector 
mismo, entonces |/(b ; )fi; = b 7 . Por lo tanto, la matriz para 
I respecto de B y a la base estándar £ es simplemente 
[bi b 2 ••• b„], Esta matriz es precisamente la matriz de 
cambio de coordenadas P[¡ definida en la sección 4.4. 


29. La matriz B para la transformación identidad es /,„ porque 
el vector de B-coordenadas del y'-ésimo vector base by es la 
y-ésima columna de /„. 


31. [M] 


-7 

0 

0 


-2 

-4 

0 


-6 

-6 

-1 


Sección 5.5, página 300 


1. X 

3. X 

5. X 


2 + / , 

3 + 2 i 

4 4 -i. 


"1 + i 
1 

— 1 — i 
4 

1 — i 
2 


X = 2 -i 
; X = 3 - 2i 
X = 4 — i 


-1 — i 
1 


-1 + i 
4 


1 + i 
2 


2 

-1 + 2 i 

' -2 - 4 i ' 

-1 + 2 i 

5 

5 


23. a ) Propiedades de conjugados y el hecho de que x T = x T . 

b) Ax = Ax y A es real; c) porque x T Ax es un escalar y 
entonces puede considerarse como una matriz de 1 x 1; 
d) propiedades de transpuestas; e) A T = A, definición de q. 

25. Sugerencia: Primero escriba x = Re x + i (Im x). 

1 -1 -1' 

-10 2 
0 0 -2 ’ 

0 2 0 _ 

0 0' 

0 0 

-4 10 

-10 —4 _ 

Son posibles otras elecciones, pero C debe ser igual a P~ l AP. 


27. [M] P = 


-1 

0 

1 

0 


c = 


-2 5 

-5 -2 

0 0 
0 o 


Sección 5.6, página 309 


1. a) Sugerencia: Encuentre a, c 2 tales que Xq = cqvi + c 2 v 2 - 
Utilice esta representación y considere el hecho de que vi 


y v 2 son vectores propios de A para calcular Xi 


49/3 

41/3 


b ) En general, Xk = 5(3)*Vi — 4(|) ,r v 2 para k > 0. 


3. Cuando p = .2, los valores propios de A son .9 y .7, y 


x* = Cl (.9)* 


+ c 2 (. l) k 



conforme k 


00 


La elevada tasa de depredación reduce el abastecimiento 
de comida de los búhos y, con el tiempo, perecen ambas 
poblaciones: presas y depredadores. 


5. Si p = .325, los valores propios son 1.05 y .55. Como 
1.05 > 1, ambas poblaciones crecerán en un 5% anual. 
Un vector propio para 1.05 es (6, 13), de manera que, con 
el tiempo, habrá aproximadamente 6 búhos manchados 
por cada 13 (mil) ardillas voladoras. 


7. X = s/X ± i , (p = n /6 radián, r = 2 

9. X = ±2i, 1 p = —n/2 radianes, r — 2 

11. X = — -v/3 ± i, (p = —5n/6 radián, r — 2 

En los ejercicios 13 a 20, son posibles otras respuestas. Cualquier 
P que haga P~ l AP igual a Co a C T e s una respuesta satisfactoria. 
Primero, encuentre P\ después, calcule P^ l AP. 


13. 


15. 

17. 


19. 


P = 

P = 

P = 

P = 


-1 

1 

3 

0 

1 

0 

2 

2 


-1 

0 

1 

2 


,C = 
,C = 

,c = 
,c = 


2 

1 

1 

-3 

-3 

-4 

.96 

.28 


-1 

2 

3" 

1 

4" 

-3 

-.28 

.96 


7. a) El origen es un punto silla porque A tiene un valor 
propio más grande que 1 y uno más pequeño que 1 
(en valor absoluto). 

b) La dirección de más fuerte atracción está dada por el vector 
propio correspondiente al valor propio 1/3, a saber, v 2 . 
Todos los vectores que son múltiplos de v 2 son atraídos 
hacia el origen. La dirección de mayor repulsión está 
dada por el vector propio Vi. Todos los múltiplos de Vi 
se repelen. 

9. Punto silla; valores propios: 2, .5; dirección de mayor 
repulsión: la recta a través de (0, 0) y (— 1, 1); dirección de 
mayor atracción: la recta por (0, 0) y (1, 4). 

11. Atractor; valores propios: .9, .8; mayor atracción: recta que 
pasa por (0, 0) y (5, 4). 

13. Repulsor; valores propios: 1.2, 1.1; mayor repulsión: recta 
que pasa por (0, 0) y (3, 4). 
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2 -1 
15. x k = Vl + ,1(.5)* -3 +.302)* 0 

1 J L 1 

conforme k —> °° 

, , 0 1 . 6 " 

17 * b)A= [.3 .8 _ 


b) La población está creciendo porque el mayor valor 
propio de A es 1.2, que es más grande que 1 en magnitud. 
La tasa de crecimiento final es 1.2, que es del 20% anual. 
El vector propio (4, 3) para Ai = 1.2 indica que habrá 

4 juveniles por cada 3 adultas. 

c) [M] La razón entre juveniles y adultas parece estabilizarse 
después de 5 o 6 años. 


Sección 5.7, página 317 

5 r —11 3 r—11 

1 . x(í) = - fe 4 '-- 7 e 21 

2 L 1 J 2 1_ 1 

5 r _ 3 1 9 r— 1 n _ 

3. — - 1 e‘ + - j e '. El origen es un punto silla. 

La dirección de mayor atracción es la recta que pasa por 
(—1, 1) y el origen. La dirección de mayor repulsión es la 
recta que pasa por (—3, 1) y por el origen. 

1 r 11 7 r 11 

5. — - 2 e 4 ' + - | e 6 '. El origen es un repulsor. 

La dirección de mayor repulsión es la recta que pasa por 
( 1 , 1 ) y por el origen. 


7. Sean P = 


_ "1 ll n _ T 4 0" 

3 lJ yD [o 6 ' 


Entonces, 


A = PDP 1 . Al sustituir x = Py en x' = Ax, se tiene 

j t {Py) = MPy) 

p y ' = PDP~\Py) = PDy 
Multiplicando por la izquierda por P~ l resulta 


y' = Dy o 


j'i 0 )_ 


0 yi(t) 

6 y 2 (t) 


9. (solución compleja): 

d [ 1 ^ ¿ 1 e< _ 2 + 0 ' 

(solución real): 


e (~ 2 +i)t + C2 


cosí + sen í 

c 1 , e + c 2 

cosí 


1 + 2 „(- 2 -¡)í 

1 J 

sení — eos í 
c 2 t ‘ 
sen í 


Las trayectorias caen en espiral hacia el origen. 


11 . (compleja) 
(real): 


mrpleja): c¡ ^ ^ ^' e 3 " + C2 ^2^' e 
al): 

—3 eos 3í — 3sen3í —3sen3í + 3 eos 3í 

2cos3í Cl 2sen3í 


13. (compleja) 


pleja): c t 1 +' + c 2 1 ¿ e^‘ 

cos3í— sen3í 1 , f sen3í + eos 3í 1 , 
: ci - o. e‘+ c 2 ~ e 

2 eos 3 í 2sen3í 


Las trayectorias son espirales que se alejan del origen. 

--ll f-61 [-4“ 

15. [M] x(í) = Ci 0 e~ 2 ' + c 2 1 e~‘ + c 3 le' 

l] |_ 5 J [_ 4. 

El origen es un punto silla. Una solución con C 3 = 0 es 
atraída hacia el origen. Una solución con ci — c 2 — 0 
es repelida. 

17. [M] (compleja): 

' -3 1 [ 23 - 34; ' 

Ci 1 e' + c 2 —9 + 14; e ( 5 + 2 0 ' 4 . 

1 J |_ 3 

L 23 + 34; 1 
c 3 -9-14; e (5 ~ 2l) ' 

3 

—3 23 eos 2í + 34sen2í 

(real): Ci 1 e' + c 2 —9eos 2í — 14sen2í e 5 ' + 

1 3 eos 2 f 

23 sen2í — 34 eos 2 1 
c 3 —9sen2í + 14cos2í e 5 ' 

3sen2í 

El origen es un repulsor. Las trayectorias son espirales hacia 
afuera, alejándose del origen. 

19 . [ M ]A=ri 3/ h 


[M] A = | , 

"iq(í)l 5 I" 1] -.5, _ I f — 3 " 

_ V 2 (í) J 2 L 2 J 2 L 2_ 

a. 

;¿(í) _ — 20 sen 6 í 

vc(t) 15 eos 6 í — 5sen6í 


Sección 5.8, página 324 

, r 1 1 , r 4.9978" 

1. Vector propio: x 4 = ^325 0 Ax4 = 1 5552 ’ 

A « 4.9978 

, w . I".51881 , r.4594" 

3. Vector propio: x 4 = ^ o Ax 4 = 9075 ; 

A «.9075 

_ f —.7999 “I , f 4.0015" 

5- 1 J^ X = [ -5.0020 


A estimada = —5.0020 

7. [M] 


Las trayectorias son elipses alrededor del origen. 


. r .751 r 1 1 r. 9932 ] r i i r. 9998 ' 

x¿ ' L1J ’ L 9565 J ’ L 1 J’L-" 9 o J’L 1 

¡i k \ 11.5, 12.78, 12.96, 12.9948, 12.9990 

9. [M] /x 5 = 8.4233, ¡i 6 = 8.4246; valor real: 8.42443 
(con 5 lugares de precisión) 
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11. n k \ 5.8000, 5.9655, 5.9942, 5.9990 (k = 1.2. 3,4); 
R(x k ): 5.9655, 5.9990, 5.99997, 5.9999993 

13. Sí, pero las secuencias pueden tener lenta convergencia. 

15. Sugerencia: Escriba Ax — ax = (A — al)x, y considere 
el hecho de que (A — al) es invertible cuando a no es un 
valor propio de A. 

17. [M] vo = 3.3384, tq = 3.32119 (con 4 lugares de precisión 
con redondeo), V 2 = 3.3212209. Valor real: 3.3212201 
(con 7 lugares de precisión) 

19. [M] a) jU6 = 30.2887 = ¿u ,7 con cuatro cifras decimales. 

Con seis lugares, el mayor valor propio es 
(.957629, .688937, 1, .943782). 

b) El método de potencias inverso (con a = 0) produce 
/zj -1 = .010141, [i 2 1 = .010150. Con siete lugares, 
el menor valor propio es 0.0101500, con vector propio 
(-.603972, 1, -.251135, .148953). La razón de la 
convergencia rápida es que el siguiente valor propio 
más pequeño (segundo en tamaño) está cerca de .85. 

21. a) Si todos los valores propios de A son menores que 1 en 
magnitud, y si x A 0, entonces A k x es aproximadamente 
un vector propio para k grande. 

b) Si el valor propio estrictamente dominante es 1, y si x 
tiene una componente en la dirección del vector propio 
correspondiente, entonces (A a x) convergerá a un múltiplo 
de ese vector propio. 

c) Si todos los valores propios de A son mayores que 1 en 
magnitud, y si x no es un vector propio, entonces la 
distancia de A k x al vector propio más cercano se 
incrementará conforme k —» c°. 

Capítulo 5 Ejercicios complementarios, página 326 


1. 

a) V 

b) F 

c ) 

V 

d) 

F 

e) V 

/) 

V 


g) F 

h) V 

i) 

F 

j ) 

V 

k) F 

1) 

F 


m) F 

n) V 

0 ) 

F 

P) 

V 

q) F 

r ) 

V 


s) F 

t) V 

u) 

V 

v) 

V 

w) F 

x) 

V 

3. 

a) Suponga que Ax = 

Ax, 

con x 

+ 0. 

Entonces, 




(51 

— A)x = 

5x — 

Ax 

= 5x • 

— Ax 

= (5-A): 

X. 



El valor propio es 5 — A. 

b) (51 — 3 A + A 2 )x = 5x — 3Ax + A(Ax) 

= 5x — 3Ax + A 2 x 
= (5 - 3A + A 2 )x. 

El valor propio es 5 — 3A + A 2 . 

5. Suponga que Ax = Ax, con x 0. Entonces, 

p(A)x = ( c 0 I + ciA + c 2 A 2 H-1- c„A")x 

= c 0 x + cq Ax + c 2 A 2 x + • • • + c„A"x 
= c ox + ciAx + C 2 A 2 x + • • • 4- c„A"x = p( A)x 

Así, p( A) es un valor propio de la matriz p(A). 

7. Si A — PDF -1 , entonces p(A) = Pp(D)P~ l , como se 
muestra en el ejercicio 6. Si la entrada (j, j) en D es A, 
entonces la entrada ( j, j) en D k es X k , de manera que 
la entrada (j, j) en p(D) es p(A). Si p es el polinomio 
característico de A, entonces p( A) = 0 para cada entrada 


diagonal de D, porque las entradas en D son los valores 
propios de A. Por lo tanto, p(D) es la matriz cero. 

Así, p(A) = P ■ 0 • P- 1 = 0. 

9. Si I — A no fuera invertible, entonces la ecuación 

(I — A)x = 0 tendría una solución no trivial. Por lo tanto, 
x — Ax = 0 y Ax = 1 -x, lo que muestra que A tendría 1 
como un valor propio. Esto no puede suceder si todos los 
valores propios son menores que 1 en magnitud. Así que 
/ — A debe ser invertible. 

11. a) Tome x en H. Entonces, x = cu para algún escalar c. 

Así, Ax = A(cu) = c(Au) = c(Au) = (cA)u, lo que 
muestra que Ax está en H. 

b) Sea x un vector diferente de cero en K. Como K es 

unidimensional, entonces K debe ser el conjunto de todos 
los múltiplos escalares de x. Si K es invariante bajo A, 
entonces Ax está en K y, por lo tanto, Ax es un múltiplo 
de x. Por consiguiente, x es un vector propio de A. 

13. 1,3,7 

15. Sustituya a por a — A en la fórmula del determinante del 
ejercicio complementario 16 del capítulo 3: 

det(A — A I) = (a — b — A)' 1-1 [a — A + (n — 1)¿>] 

Este determinante es cero solo si a — b — A = 0o 
a — A + (n — l)b = 0. Así, A es un valor propio de A 
si y solo si A = a — b o A = a + (n — 1 )b. De la fórmula 
anterior para det(A — A/), la multiplicidad algebraica es 
n — 1 para a — b y 1 para a + (n — 1 )b. 

17. det(A — XI) = (fln — X)(a 22 — A) — ai 2 a 2 i = 

A 2 — (a 11 + a 22 ) A + (a\\a 22 — o\ 2 a 2 \) = 

A 2 — (tr A)A + det A. Utilice la fórmula cuadrática para 
resolver la ecuación característica 


A = 


tr A ± ^/(tr A) 2 — 4 det A 
2 


Ambos valores propios son reales si y solo si el 
discriminante es no negativo, es decir, (tr A) 2 — 4 det A a 0. 
Esta desigualdad se simplifica a (tr A) 2 a 4 det A 
/ tr A \ 2 

y( —j — det A. 


19. C, 


0 

-6 


1 

5 


; det(C p — XI) = 6 — 5A + A 2 = p( A) 


21. Si p es un polinomio de orden 2, entonces un cálculo 
tal como el del ejercicio 19 muestra que el polinomio 
característico de C p es p( A) = (—l) 2 p(A), de manera que 
el resultado es verdadero para n = 2. Suponga que el 
resultado es válido para n = k para alguna A a 2, y considere 
un polinomio p de grado k + 1. Entonces, al desarrollar 
detíCj, — XI) por cofactores en la primera columna, 
el determinante de C p — XI es igual a 

r-A 1 ••• 0 "I 


(—A) det 


0 


—a 1 


1 

—a k — X 


+ (—l) i+1 a 0 


—Cl2 
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La matriz dekxk que se muestra es C q — XI. donde 
q(t) = ai + ajt + • • • + a k t k ~ l + t k . Por la suposición de 
inducción, el determinante de C q — XI es (— l/g(A). Así, 

de\.(C p -XI) = (-1)* +1 « 0 + f-A)(-l)^(A) 

= ( — l/"*" 1 [tto X(ü\ + • • • + a k X k 1 + A ¿ )] 

= (-l) k+l P (X) 

Entonces la fórmula es válida para n = k + 1 cuando es 
verdadera para n = k. Por el principio de inducción, la fórmula 
para det(C p — XI) es correcta para toda n S 2. 

23. Del ejercicio 22, las columnas de la matriz de Vandermonde 
V son vectores propios de C p , que corresponden a los valores 
propios Ai, A 2 , A 3 (las raíces del polinomio p). Como esos 
valores propios son distintos, los vectores propios forman 
un conjunto linealmente independiente, de acuerdo con el 
teorema 2 de la sección 5.1. Así, V tiene columnas linealmente 
independientes y, por lo tanto, es invertible, según el teorema 
de la matriz invertible. Por último, como las columnas de V 
son vectores propios de C p , el teorema de diagonalización 
(teorema 5 de la sección 5.3) indica que V~ 1 C p V es diagonal. 

25. [M] Si su programa de matrices calcula valores propios 
y vectores propios mediante métodos iterativos en vez de 
utilizar cálculos simbólicos, podría tener algunas dificultades. 
Encontrará que AP — PD tiene entradas extremadamente 
pequeñas y que PDP 1 es muy cercana a la matriz A. 

(Esto sucedía hasta hace pocos años, pero la situación 
podría cambiar conforme mejoren los programas de matrices). 
Si P se construye con los vectores propios del programa, 
entonces compruebe el número de condición de P. Esto puede 
indicar que en realidad no se tienen tres vectores propios 
linealmente independientes. 


Capítulo 6 


Sección 6.1, página 336 


1. 5,8, ¡ 
7. -\/35 


3. 


3/35 

-1/35 

-1/7 


8/13 

12/13 



11 . 


'7/V69' 

2/V69 

_4/V69_ 


13. 5-v/5 


15. No son ortogonales 17. Ortogonales 


31. Sugerencia: Si x está en W ± , entonces x es ortogonal a todo 
vector en W. 

33. [M] Establezca su suposición y compruébela algebraicamente. 


Sección 6.2, página 344 

1. No son ortogonales 3. No son ortogonales 5. Ortogonales 

7. Demuestre que urU 2 = 0, mencione el teorema 4, y observe 
que dos vectores linealmente independientes en IR 2 forman 
una base. Después obtenga 


r 21 


reí 

I J 

r 21 

1 

reí 

1 

1 

1_ 

1 ¿b 

' 52 

1 

1_ 

II 

O- 

1 

1 

LO 

1_ 

+ 2 

1 

Tf 

_1 


9. Demuestre que 11 1 ■ U 2 — 0, 11 1 u 3 = 0, y u 2 -u 3 = 0. Mencione 
el teorema 4, y observe que tres vectores linealmente 
independientes en IR 3 forman una base. Después obtenga 


X = f u i - ffu 2 + f u 3 = fuj - |u 2 + 2 u 3 



13. y = 



14/5 

8/5 


15. 


y-y = 



la distancia es 1 



" l/x/3" 

"-1/V2' 

17. 

1/-/3 , 

0 


_l/x/3_ 

1/V2_ 


19. Ortonormales 21. Ortonormales 

25. Sugerencia: || t/x|| 2 = (Ux) T (U x). Además, los incisos a) y c) 
se deducen de b). 


27. Sugerencia: Se necesitan dos teoremas, uno de los cuales 
solamente se aplica a matrices cuadradas. 


29. Sugerencia: Si se tiene un candidato para una inversa, 
es posible revisar si el candidato funciona. 

* y-u 

31. Suponga que y = -u. Remplace u por cu con c A 0; 

u-u 


entonces. 


y-(cu) 
(cu) - (cu) 


(cu) = 


c(y-u) 

C 2 U-U 


(c)u = 


y 


33. Sea L = Gen ¡u}, donde u es diferente de cero, y 
T(x) = proy¿ x. Por definición. 


21. Sugerencia: Utilice los teoremas 2 y 3 de la sección 2.1. 

23. u-v = 0, ||u|| 2 = 30, ||v|| 2 = 101, 

||u + v|| 2 = (— 5) 2 + (— 9) 2 + 5 2 = 131 = 30 + 101 


25. 

27. 

29 . 


El conjunto de todos los múltiplos de 


-b 

a 


(cuando v A 0) 


Sugerencia: Aplique la definición de ortogonalidad. 

Sugerencia: Considere un vector típico w = CiVi + ••• + c p \ p 
en W. 


T(x) = — u = (x-u)(u-u) _1 u 

u-u 

Para x y y en IR" y cualesquiera escalares c y d. las propiedades 

del producto interior (teorema 1) indican que 

T (ex + d y) = [(ex + d y) • u] (u- u) _1 u 

= [c(x-u) + d(y-u)](u-u) - ' 1 u 
= c(x-u)(u-u) _1 u + á(y-u)(u-u) _1 u 
= c T (x) + dT( y) 

Por lo tanto, T es lineal. 
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Sección 6.3, página 352 




' l/s/5 

1/2 

1/2- 






-1/V5 

0 

0 


0 


10 

r 

15. Q = \ 

-l/s/5 

1/2 

1/2 

X = 

— Z 

A 

+ 

—0 


l/s/5 - 

-1/2 

1/2 


_ —2 _ 


—z 

2 _ 


. l/s/5 

1/2 -1/2 J 





\ 

~ s/5 -s/5 

4V5l 



'-1' 


'-1 ' 

3. 

4 

5. 

2 


0 


6 


= y 



' 10/3 


'-7/3 

7. y = 

2/3 

+ 

7/3 


8/3 


7/3 



~ 3" 


'-1' 

11. 

-1 

13. 

-3 

1 

-2 


-1 


3 


9. y = 


15. V40 


"2" 


2 ' 

4 


-1 

0 

+ 

3 

0 


-1 


17. a) t/ 7 // = 


" 1 0" 
0 1 _ 


8/9 

-2/9 

2/9 

,UU T = 

-2/9 

5/9 

4/9 


2/9 

4/9 

5/9 _ 



"2" 


'2' 

b) proyiy y = 6ui + 3u 2 = 

4 

, (UU T )y = 

4 


5 


5 



' 0 


'0' 

19. Cualquier múltiplo de 

2/5 

, tal como 

2 


_ 1/5 _ 


1 


23. Sugerencia: Utilice el teorema 3 y el teorema de 

descomposición ortogonal. Para la unicidad, suponga 
que Ap = b y Api = b, y considere las ecuaciones 
p = pi + (p - pi)y p = p + 0. 


Sección 6.4, página 358 


1. 


5. 


3" 


'-1 ' 

0 


5 

-1_ 


_ —3 _ 

1 " 


5' 

-4 


1 

0 

’ 

-4 

1 _ 


-1 _ 

3" 


1 ' 

1 


3 

-1 

’ 

3 

3 


-1 


3. 


7. 


2 

-5 

1 



3 

, 

3/2 


3/2 


2/V30 

-5/V30 

1/V30J 


2/V6' 

1/s/l 

1/s/l. 


11 . 


r 


3" 


2' 

-1 


0 


0 

-1 

, 

3 

, 

2 

1 


-3 


2 

1 


3 


-2 


13. R = 


12 

6 


R = 


19. 


21 . 


Suponga que x satisface Rx = 0; entonces, QRx = Q0 = 0, 
y Ax = 0. Como las columnas de A son linealmente 
independientes, x debe ser cero. A la vez, este hecho indica 
que las columnas de R son linealmente independientes. 
Como R es cuadrada, entonces es invertible, de acuerdo con 
el teorema de la matriz invertible. 

Denote las columnas de Q como qi,..., q„. Observe que 
n S m, porque A es de m x n y tiene columnas linealmente 
independientes. Considere el hecho de que las columnas 
de Q pueden ampliarse a una base ortonormal para IR"', 
por ejemplo, { qi,..., q m }. (La Guía de estudio describe 
un método). Sea Q 0 = [q„ +1 ••• q nl ]yQi = [Q O 0 ] 

Entonces, al utilizar la multiplicación matricial particionada, 

ol = e* = /<. 


23. Sugerencia: Particione R como una matriz por bloques 
de 2x2. 

25. [M] Las entradas diagonales de R son 20, 6, 10.3923 y 7.0711, 
con cuatro cifras decimales. 


Sección 6.5, página 366 

6 —11 X\ 

-11 22 x 2 


1 . a) 

3. a) 


-4 

11 


6 

42 


x¡ 

X 2 


6 

-6 


b) x = 
b) x = 


3 
2 

4/3 

-1/3 


5. x = 


9. a) b = 


11. a) b 


13. Au = 


b - Au = 


5" 


-3 

0 

+ -*3 


-1 

1 

1 


b) x = 


7. 2x/5 


2/7 

1/7 


b) x = 

"2/3 

0 


- 1 / 3 . 


11 ' 


7' 

-11 

, A\ = 

-12 

11 


7 


0 

2 

-6 


b — Ay = 


4 

3 

-2 


. No, u posiblemente 


15. x = 


no podría ser solución de mínimos cuadrados de Ax = b. 
¿Por qué? 

4 ' 


-1 
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19. a) Si Ax = 0, entonces A T Ax = A r 0 = 0. Esto muestra que 
Nul A está contenido en Nul A T A. 

b) Si A t Ax = 0, entonces x T A T A x = x r 0 = 0. 

Así, (Ax) T (Ax) = 0 (lo que significa que ||Ax|p = 0), 
y por lo tanto, Ax = 0. Esto muestra que Nul A T A 
está contenido en Nul A. 

Sugerencia: Para el inciso a ), utilice un importante teorema 
del capítulo 2. 

De acuerdo con el teorema 14, b = Ax = A(A T A)~ l A T b. 
La matriz A(A T A)~ 1 A T se presenta con frecuencia en 
estadística, donde en ocasiones se le conoce como 
matriz sombrero. 

Las ecuaciones normales son 

cuya solución es el conjunto de (x, y) tal que x + y = 3. 

Las soluciones corresponden a puntos sobre la recta 
intermedia entre las rectas x + y = 2y x + y = A. 

Sección 6.6, página 374 

1. v = .9 + Ax 3. y = 1.1 + 1.3.v 

5. Si dos puntos de datos tienen diferentes coordenadas x, 
entonces las dos columnas de la matriz de diseño X no 
pueden ser múltiplos entre sí y, por lo tanto, son linealmente 
independientes. De acuerdo con el teorema 14 de la sección 
6.5, las ecuaciones normales tienen solución única. 

' 1 . 8 " 

2.7 

7. a) y = Xfi + e , donde y = 3.4 , X 

3.8 

_ 3.9_ 

€1 " 

€2 
£3 
€4 
€5 _ 

b ) [M] y = 1.76* - .20* 2 

7.9 eos 1 sen 1 

9. y = Xfi + e, donde y = 5.4 , X = cos2 sen2 , 

_ — .9 _cos 3 sen3_ 



11. [M] ¡3 = 1.45 y e = .811; la órbita es una elipse. La ecuación 
r = /3/( 1 — e ■ eos #) produce r = 1.33 cuando ■& = 4.6. 

13. [M] a) y = -.8558 + 4.7025f + 5.5554í 2 - .0274 1 2 
b) La función velocidad es 

v{t) = 4.7025 + 11.1108f - .0822f 2 , y 
v(4.5) = 53.0 ft/seg. 

15. Sugerencia: Escriba X y y como en la ecuación (1), y calcule 
X T X y X T y. 

17. a) La media de los datos en x es x = 5.5. Los datos en 

forma de desviación media son ( — 3.5, 1), (—.5, 2), (1.5, 3) 




'2 21 r jc 1 _ I - 6" 

_2 2 _|[y J ~ L 6 .’ 


21 . 

23. 

25. 


y (2.5, 3). Las columnas de X son ortogonales porque las 
entradas en la segunda columna suman 0 . 


'4 0-poir 9' 

0 21 J [ J L 7 - 5 J’ 

y = z + fi x * = ! + £(*-5.5) 


19. Sugerencia: La ecuación tiene una agradable interpretación 
geométrica. 


Sección 6.7, página 382 

1. a) 3, \! 105, 225 b) Todos los múltiplos de 

3. 28 5. 5V2, 3^3 7. | + iíf 

9. a) Polinomio constante, p(t) = 5. 

b) t 2 — 5 es ortogonal apo y P\\ valores: 

(4, —4, —4. 4); respuesta: q(t) = \{t 2 — 5) 

11 . %t 

13. Compruebe cada uno de los cuatro axiomas. Por ejemplo: 
1. (u, v) = (Au)-(^v) Definición 

= (AvM^ii) Propiedad del producto 
= (v, u) Definición 



15. (u. ex) = (ex, u) Axioma 1 
= c(v, u) Axioma 3 
= c(u. v) Axioma 1 

17. Sugerencia: Calcule 4 veces el lado derecho. 

19. (u, v) = ^faxíb + \TbJa = 2 sfab, 

|| u || 2 = (\/a) 2 + ( s/b) 1 = a + b. Como ay b son 
no negativos, ||u|| = + b. De forma similar, 

||v|| = \/b + a. De acuerdo con Cauchy-Schwarz, 

2 sfab < V a + b^/b + a = a + b. Por lo que sfab 
21. 0 23. 2/V5 25. 1, í, 3t 2 - 1 


a + b 
2 


27. [M] Los nuevos polinomios ortogonales son múltiplos de 

— 17r + 5í 3 y 72 — 155í 2 + 35/ 4 . Escale esos polinomios para 
que sus valores en — 2 , — 1 , 0 , 1 y 2 sean enteros pequeños. 


Sección 6.8, página 389 

1 . y = 2 + \t 

3. p(t) = 4p 0 -Ap¡ - ,5p 2 +.2p 3 

= 4-.lr-.5(í 2 -2) + .2(|í 3 -fí) 

(Este polinomio ajusta los datos de manera exacta). 
5. Utilice la identidad 

sen mt sen nt = 2 [eos (mt — nt) — cosí mt + nt)\ 


7. Aplique la identidad eos 2 k t = 


1 + eos 2 kt 


9. tt + 2 sen t + sen 2t + 3 sen 3 1 [Sugerencia: Ahorre tiempo 
empleando los resultados del ejemplo 4], 

11. ] 2 ~ 2 cos ¿P° r 
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13. Sugerencia: Tome las funciones /y g en C[0, 2-77], y fije 
un entero m £ 0. Escriba el coeficiente de Fourier de / + g 
que implique a eos mt , y también escriba el coeficiente de 
Fourier que implique a sen mt (m > 0). 

15. [M] La curva cúbica es la gráfica de 

g(t ) = -.2685 + 3.6095? + 5.8576 1 2 - ,0477r 3 . 

La velocidad en t = 4.5 segundos es g'(4.5) = 53.4 ft/seg. 
Esto es aproximadamente .7% más rápido que la estimación 
obtenida en el ejercicio 13 de la sección 6.6. 


Capítulo 6 Ejercicios complementarios, página 390 


1. a) F 

b) V 

c) V 

d ) F 

e) F 

/) v 

g) v 

h) V 

i) F 

j) v 

k) V 

I) F 

m) V 

n) F 

0 ) F 

P) v 

q) V 

r) F 


s ) F 

2 . Sugerencia: Si {vi, V 2 } es un conjunto ortonormal y 
x = C1V1 + C2V2, entonces los vectores nvi y C2V2 
son ortogonales, y 

INI 2 = \\C1V1 + c 2 v 2 || 2 = IkiVj II 2 + ||c 2 v 2 || 2 
= (k,ll|v 1 ||) 2 + (| C 2 ll|v 2 ||) 2 =|c 1 | 2 +|c 2 | 2 
(Explique por qué). Así que la igualdad establecida es válida 
para p = 2. Suponga que la igualdad es verdadera para p = k, 
con ls2, sea {vi,..., v^+ij un conjunto ortonormal, y con¬ 
sidere que x = C 1 V 1 + ■•■ + c k \k + c*+iv*+i = u* + cjt+iVjt+t, 
donde u k = civi + ■ • • + cjtv*. 


ecuaciones es Ax = b, y el conjunto de todas las soluciones 
de mínimos cuadrados coincide con el conjunto de 
soluciones de A T Ax = A r b (teorema 13 de la sección 6.5). 
Estudie esta ecuación, y considere el hecho de que 
(vv T )x = v(v r x) = (v r x)v, porque v T x es un escalar. 

13. a) El cálculo fila-columna de Au muestra que cada fila de A 
es ortogonal a cada u en Nul A. Así, cada fila de A está en 
(Nul A) 2 -. Como (Nul A) 2 - es un subespacio, debe contener 
a todas las combinaciones lineales de las filas de A; por lo 
que (Nul A) 2 - contiene a Fil A. 

b) Si rango A — r, entonces dim Nul A = n — r, de acuerdo 
con el teorema del rango. Por el ejercicio 24c) de la sección 
6.3, 

dim Nul A + dim(Nul A)^ = n 

Así, dim (Nul A) 2- debe ser r. Pero Fil A es un subespacio 
r-dimensional de (Nul A) 2 -, de acuerdo con el teorema del 
rango y el inciso a). Por lo tanto, Fil A debe coincidir con 
(Nul A) 2 -. 

c) Sustituya A por A T en el inciso b ) y concluya que 

Fil A T coincide con (Nul A 7 ) 2 -. Como Fil A T = Col A, 
esto prueba c). 

15. Si A = URU T con U ortogonal, entonces A es similar a R 
(porque U es invertible y U T = í/ _1 ) y así A tiene los 
mismos valores propios que R (de acuerdo con el teorema 4 
de la sección 5.2), a saber, los n números reales sobre 
la diagonal de R. 


3. A partir de x y un conjunto ortonormal {Vi,..., \ p } en IR", 
sea x la proyección ortogonal de x sobre el subespacio 
generado por Vi,..., \ p . De acuerdo con el teorema 10 
de la sección 6.3, 


17. 


[M] 


II Ax|| 


cond(A) x 


= .4618, 

= 3363 x (1.548 x 1(T 4 ) = .5206. 

I|b|| 


X = (x-Vl)Vl -i-h (x-\p)\ p 

Por el ejercicio 2. ||x|| 2 = |x-vi | 2 + • • • + |x-v p | 2 . 

La desigualdad de Bessel se deduce del hecho de que 
||x|| 2 < ||x|| 2 , observado antes del enunciado de la 
desigualdad de Cauchy-Schwarz, en la sección 6.7. 

5. Suponga que (Ux)-(Uy) = x-y para toda x, y en IR", 
y sea ei,..., e„ la base estándar para IR". Para j — 1 
Utj es la y-ésima columna de U. Puesto que 
||í/e 7 j| 2 = (Utj)-(Utj) = epey = 1, las columnas de U son 
vectores unitarios; puesto que (Uej)-(Ue k ) = epe* = 0 para 
j A k, las columnas son ortogonales en pares. 

7. Sugerencia: Calcule Q T Q, considerando el hecho de que 
(uu r ) r = u TT u T = uu r . 


Observe que ||Ax||/||x|| casi es igual a cond(A) por ||Ab||/||b||. 


19. [M] = 7.178 x 1(T 8 , = 2.832 x 10“ 4 . 


Observe que el cambio relativo en x es mucho más pequeño 
que el cambio relativo en b. En efecto, puesto que 


cond(A)x 


IIAblI 


= 23,683 x (2.832 x KT 4 ) = 6.707 


el límite teórico del cambio relativo en x es 6.707 (con cuatro 
cifras significativas). Este ejercicio muestra que aun cuando 
el número de condición es grande, el error relativo en una 
solución no necesita ser tan grande como se podría esperar. 


9. Sea W = Gen ¡u, vj. Dada z en IR", sea z = proyiyz. Entonces 
z está en Col A, donde A = [u v], por ejemplo, z = Ax para 
alguna x en IR 2 . Así, x es una solución de mínimos cuadrados 
de Ax = z. Las ecuaciones normales se pueden resolver para 
producir x, y después z se determina calculando Ax. 


Capítulo 7 

Sección 7.1, página 399 

1. Simétrica 3. No es simétrica 5. No es simétrica 


11 . 



X 


a 


1 _ 

y 7. Ortogonal, 

'.6 .8" 

Sugerencia: Sean x = 

y 

, b = 

b 

, v = 

-2 

.8 —.6 _ 


z 


c 


5 




9. No ortogonal 



r t ~ 
x 1 


' 1 -2 

5 



2/3 

0 

V5/3 

A = 

v r 

= 

1 -2 

5 

. El conjunto dado de 

11. Ortogonal, 

2/3 

l/x/5 

-4/V45 


_v r _ 


1 -2 

5 


1/3 

-2/V5 

-2/V45 
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13. P 


1/V2 -1/V2 
1/V2 1/V2 



0 

2 


15. P 


—4/x/Í7 

1/VÍ7 

, D = 

' 17 

0' 

1/vT7 

4/VT7 

0 

0_ 




l/x/3 

1/V6 - 

- 1 /V 2 


17. 

P = 

l/x/3 - 

-2/V6 

0 

, 



l/x/3 

1/V6 

1 /V 2 




'5 

0 

0“ 





D = 

0 

2 

0 






0 

0 

-2 






r- 

l/x/5 

4/V45 

-2/3 

19. 

P = 

2/V5 

2/V45 

-1/3 




0 

5/V45 

2/3 _ 



'7 

0 

0“ 





D = 

0 

7 

0 






0 

0 

-2 






'.5 

-.5 

-1/V2 

0 

1 

21. 

P = 

.5 

.5 

.5 

-.5 

0 

1/-/2 

-1/V2 

0 



_ -5 

.5 


0 

l/x/2. 



'9 

0 

0 

0" 




D = 

0 

5 

0 

0 




0 

0 

1 

0 





0 

0 

0 

1 





l/x/3 - 

-l/x/2 - 

-1/V6 


23. 

P = 

l/x/3 

l/\/2 - 

-1/V6 

, 



1/V3 

0 


2/x/6 




'5 

0 

0“ 





D = 

0 

2 

0 






0 

0 

2 





27. (B T AB) T 


B T A T B TT Producto de transpuestas 
en orden inverso 

B t AB Porque A es simétrica 


El resultado sobre B t B es un caso especial cuando A = /. 
(BB T ) T = B tt B t = BB T , por lo que BB T es simétrica. 


29. Sugerencia: Utilice una diagonalización ortogonal de A, 
o recurra al teorema 2. 


31. El teorema de diagonalización de la sección 5.3 
dice que las columnas de P son vectores propios 
(linealmente independientes) correspondientes a los 
valores propios de A listados en la diagonal de D. 

Así, P tiene exactamente k columnas de vectores propios 
correspondientes a A. Esas k columnas forman una base 
para el espacio propio. 


33. A = 8 uiuf + óinuj + 3113 U 3 



- 1/2 

1/2 

0 


0 

0 

o 



1/6 

1/6 

-2/6 

+ 6 

1/6 

1/6 

-2/6 


-2/6 

-2/6 

4/6 


'1/3 

1/3 

1/3' 

+ 3 

1/3 

1/3 

1/3 


1/3 

1/3 

1/3 


35. Sugerencia: (uu r )x = u(u r x) = (u r x)u, porque u r x 
es un escalar. 


Sección 7.2, página 406 

1. a) 5xf + f.TiA '2 + x\ b ) 185 c) 16 


3. a) 

' 10 
-3 

-3' 

-3 


b) 

5 

.3/2 


3/2" 

0 


8 

-3 

2“ 


'0 

2 

3' 

5. a) 

-3 

7 

-1 

b) 

2 

0 

-4 


2 

-1 

-3 


3 - 

-4 

0 


> y T Dy = 6y\ — 4yf. 

En los ejercicios 9 a 14, son posibles otras respuestas (cambio de 
variables y nueva forma cuadrática). 


7. x = Py, donde P 


x/2 


9. 


11 . 


Positiva definida; los valores propios son 2 y 7. 
Cambio de variable: x = Py, con P = —— \ 

V5L 2 

Nueva forma cuadrática: ly\ 4- 2 y\ 

Indefinida; los valores propios son 7 y —3 

1 f 1 - 

Cambio de variable: x = Py, con P = —¡= , 

x/sL 1 

Nueva forma cuadrática: ly\ — 3yf 


2 

1 


13. 


Positiva semidefinida; los valores propios son 0 y 10 


Cambio de variable: x = Py, con P 
Nueva forma cuadrática: lOyj 5 


1 


yio 


1 

-3 


3 

1 


15. [M] Negativa semidefinida; los valores propios son 
0 , - 6 , - 8 , -12 
Cambio de variable: x = Py; 



3/y/Í2 

0 

-1/2 

0 

/J — 

l/y/Í2 

-2/V6 

1/2 

0 


l/x/12 

1/V6 

1/2 

— l/x/2 


l/x/Í2 

1/V6 

1/2 

l/x/2_ 

Nueva forma cuadrática: - 

-6yf - 

8y 3 2 - 12 y| 


17. [M] Indefinida; los valores propios son 8.5 y —6.5 
Cambio de variable: x = Py; 


P = 


1 

n/50 


3-434 
5 0-50 

4 3 4 -3 
0 5 0 5 
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Nueva forma cuadrática: 8.5.v 2 + 8 ,5y\ - 6 ,5v| - 6.5.V4 Sección 7.4, página 423 


19. 8 


1. 3, 1 3. 3, 2 


23. Escriba el polinomio característico de dos formas: 

det(A — XI) = det a ^ ^ 

b el — A 

= A 2 — (a + d) A + ad — b 2 

y 

(A - A0(A - A 2 ) = A 2 - (Ai + A 2 )A + AíA 2 

Iguale los coeficientes para obtener Ai + A 2 = a + d y 
AiA 2 = ad — b 2 = det A. 


25. El ejercicio 27 de la sección 7.1 demostró que B T B es 
simétrica. Además, x T B T Bx = (Bx) T Bx = ||5x|| 2 > 0, 
así que la forma cuadrática es positiva semidefinida, 
y se dice que la matriz B T B es positiva semidefinida. 
Sugerencia: Para demostrar que B J B es positiva definida 
cuando B es cuadrada e invertible, suponga que 
x t B t Bx = 0 y deduzca que x = 0. 

27. Sugerencia: Demuestre que A + B es simétrica y que la forma 
cuadrática x T (A+B)x es positiva definida. 

Sección 7.3, página 413 



1/3 

2/3 

-2/3 

1. x = P y, donde P = 

2/3 

1/3 

2/3 

r 

_ —2/3 

1/31 

2/3 

1/3 


3. a) 9 b) ± 


2/3 

-2/3 


c ) 6 


5. a) 1 b) ± 


-1/72 

1/V2 


7. ± 


1/3' 

2/3 

2/3 


c) 3 


9. 5 + a/5 11. 3 


13. Sugerencia: Si m = M, tome a = 0 en la fórmula para x. Es 
decir, sea x = u„, y compruebe que x T Ax = m. Si m < M y 
si t es un número entre m y M, entonces 0 < í — m £ M — 
m y 0 £ (t — m)/(M — ni) ^ 1. Sea a = (t — m)/(M — mi). 
Resuelva la expresión para a para ver que t = (1 — á)m + 
aM. Conforme a va de 0 a 1, t va de m a M. Construya x como 
en el enunciado del ejercicio, y compruebe sus propiedades. 


15. [M] a) 7.5 


b) 


.5 

.5 

.5 

.5 


17. [M] a) -4 


b) 


- 3 /Vf2 
I/Vñ 
1/VÍ2 
1/712 


c) -.5 


c) -10 


Las respuestas en los ejercicios 5 a 13 no son las únicas 
posibilidades. 


5. 

'-3 0' 


r-i 

0‘ 

' r 3 

0 ' 

" 1 

0' 


0 0_ 


L 0 7 

. L° 

0_ 

0 

1 


7. 

1/75 - 

-2/75 

'3 

0' 

2/75 

1/75 

2/75 

1/75 

0 

2 

[-1/75 2/75 


"1/72 - 

-1/72 

0' 

r 37 tó 

0 



9. 

0 

0 

1 


0 

7IÓ 




. 1/72 

1/72 

0_ 


0 

0 




2/75 1/75 

-1/75 2/75 



■-1/3 

2/3 

2/3' 

'37To 

0 

11 . 

2/3 

-1/3 

2/3 

0 

0 


2/3 

2/3 

-1/3 

0 

0 


3/TTó -í/TIó 
i/7To 3/7 To 



2 2 

3 -2 


1/72 

-1/72 

'5 0 0' 

1/72 

1/72 

0 3 0 


X 


1/72 

-1/718 

-2/3 


1/72 o 
1/718 -4/718 
2/3 1/3 


15. a) rango A = 2 

b) Base para Col A: 


.40 

.37 

-.84 


-.78 

-.33 

-.52 


Base para Nul A: 


.58 

-.58 

.58 


(Recuerde que V T aparece en la DVS ). 


17. SeaA = ITZV T = I/SV -1 . Puesto queA es cuadrada 
e invertible, rango A — n, y todas las entradas en la 
diagonal de 2 deben ser distintas de cero. 

Así, A -1 = (U2,V~ l y l = = V2T 1 [/ r . 

19. Sugerencia: Como U y V son ortogonales, 

A T A = (VLV T ) r UHV T = VT¡ r U T U'LV T 
= L(E r E)L- 1 

Así, V diagonaliza A T A. ¿Qué indica esto acerca de V? 

21. Sea A = WZV T . La matriz PU es ortogonal, porque P y U 
son ortogonales. (Véase el ejercicio 29 de la sección 6.2). 
Así, la ecuación PA = ( PUyZV 7 tiene la forma requerida 
para una descomposición en valores singulares. Según el 
ejercicio 19, las entradas diagonales en 2 son los valores 
singulares de PA. 

23. Sugerencia: Utilice la expansión columna-fila de (U 2)V r . 
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25. Sugerencia: Considere la DVS para la matriz estándar de T, 
por ejemplo, A —U'ZV 7 = t/EV -1 . Sean B — {vi,..., v„}y 
C = {ui,..., u„,} bases construidas de las columnas de Vy U, 
respectivamente. Calcule la matriz para T respecto de B y C, 
como en la sección 5.4. Para hacer esto, se debe probar que 
V 'vy = Cj, lay-ésima columna de 


-.57 

-.65 

-.42 

.27 

.63 

-.24 

-.68 

-.29 

.07 

-.63 

.53 

-.56 

-.51 

.34 

-.29 

-.73 


16.46 

0 


0 

0 

0 

0 

12.16 

0 

0 

0 

0 

0 


4.87 

0 

0 

0 

0 


0 

4.31 

0 

-.10 

.61 - 

-.21 

-.52 

.55" 


-.39 

.29 

.84 

-.14 

-.19 


-.74 

-.27 - 

-.07 

.38 

.49 


.41 

-.50 

.45 

-.23 

.58 


-.36 

-.48 - 

.19 

-.72 

-.29 



29. [M] 25.9343, 16.7554, 11.2917, 1.0785, .00037793; 

di/o 5 = 68,622 


s = jki BBT = TTlfc • ^ 


x, 


x. 


N 


1 N t i N 

— = N _ } - M )( X * - M > 7 


Capítulo 7 Ejercicios complementarios, página 432 


1. a) V 

b) F 

c) V 

d) F 

e) F 

/) F 

g) F 

h) V 

i) F 

í) F 

k) F 

/) F 

m)V 

n) F 

0 ) V 

P) v 

q) F 



3. Si rango A = r, entonces dim Nul A = n — r, de acuerdo 
con el teorema del rango. Así, 0 es un valor propio con 
multiplicidad n — r. Por lo tanto, de los n términos en la 
descomposición espectral de A, exactamente n — r son nulos. 
Los restantes r términos (correspondientes a los valores 
propios diferentes de cero) son matrices con rango 1 , como se 
mencionó en el análisis de la descomposición espectral. 

5. Si Av = Av para alguna A diferente de cero, entonces 
v = A Ay = A(A _ 1 v), lo que muestra que v es una 
combinación lineal de las columnas de A. 


Sección 7.5, página 430 


1. M = 

S = 


" 12 " 

; B = 

"7 

10 -6 

-9 

-10 

8 " 

. 10 _ 

86 

-27 

-27" 

16 

2 

-4 -1 

5 

3 

—5_ 


3. 


.95 

.32 


para A = 95.2, 


.32 

.95 


para A = 63 


5. [M] (. 130, 874, 468), 75.9% de la varianza 

7. vi = .95.íi — .32.V2; yi explica el 93.3% de la varianza. 

9. ci = 1/3, C 2 = 2/3, C 3 = 2/3; la varianza de y es 9. 

11. a) Si w es el vector en [R' v con un 1 en cada posición, entonces 


[Xi ••• Xjv ] w = X] + • • • + X N = 0 


porque las X* están en la forma de desviación media. 
Entonces, 

[Y! ••• Yjv] w 

= [P r Xi ••• P r Xjv]w Por definición 
= P T [X 1 ••• X N ] w = P T 0 = 0 

Es decir, Yj + ■ • ■ + Y# = 0, por lo que las Y* están 
en forma de desviación media. 

b) Sugerencia: Como las X ; - están en forma de desviación 
media, la matriz de covarianza de las X ; - es 

1/(JV-1)[X! ••• XjvjfX! ••• x n ] t 

Calcule la matriz de covarianza de las Y ¡, con base en el 
inciso a). 

13. Si B = [X] ••• Xjv], entonces 


7. Sugerencia: Si A = R T R, donde R es invertible, entonces A 
es positiva definida, por el ejercicio 25 de la sección 7.2. 

Al contrario, suponga que A es positiva definida. Entonces 
por el ejercicio 26 de la sección 7.2, A = B J B para alguna 
matriz positiva definida B. Explique por qué B admite 
una factorización QR, y úsela para crear la factorización 
de Cholesky de A. 

9. Si A es de m x n y x está en IR", entonces 

x T A T Ax = (Ax) r (Ax) = ||Ax|| 2 > 0. Así, A T A es positiva 
semidefinida. Por el ejercicio 22 de la sección 6.5, 
rango A t A = rango A. 

11. Sugerencia: Escriba una DVS de A en la forma 
A = DSV r = PQ, donde P = U^U T y Q = UV T . 

Demuestre que P es simétrica y con los mismos valores 
propios que S. Explique por qué Q es una matriz ortogonal. 

13. a ) Si b = Ax, entonces x + = A + b = A + Ax. De acuerdo 
con el ejercicio 12a), x + es la proyección ortogonal 
de x sobre Fil A. 

b ) A partir de a) y del ejercicio 12c), 

Ax+ = A(A+Ax) = (AA+A)x = Ax = b 

c) Como x + es la proyección ortogonal sobre Fil A, el teorema 


de Pitágoras indica que || u || 2 

= II x 

+ ll 2 + llu-s 

■+II 2 . 

El inciso c) se deduce inmediatamente. 




"-2 

-14 

13 

13" 


.7" 

, 1 

[M] A+ = —■ 
40 

-2 

-14 

13 

13 


.7 

-2 

2 

6 

-6 

-7 

7 

-7 

7 

, X = 

OO OO 

f 


4 

-12 

-6 

-6 


L -6j 

r a 

La forma escalonada reducida de T 

X 1 

es la misma que la 


forma escalonada reducida de A, excepto por una fila 
adicional de ceros. Así que al sumar múltiplos escalares 
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de las filas de A a x r se puede obtener el vector cero, lo que 
prueba que x T está en Fil A. 


Base para Nul A: 


'- 1 ' 


" 0 " 

1 


0 

0 


1 

0 


1 

0 


0 


Capítulo 8 

Sección 8.1, página 442 


25. Para demostrar que D C E H F, demuestre que D C E y 
DCF. 

Sección 8.2, página 452 

1. Afínmente dependiente y 2v¡ + V 2 — 3 V 3 = 0. 

3. El conjunto tiene independencia afín. Si los puntos son 
Vi, V2, v 3 y V4, entonces ¡vi, V2, V3} es una base para IR 3 , 
y V 4 = 16vi + 5 v 2 - 3 v 3 , pero los pesos en la combinación 
lineal no suman 1 . 


1. Algunas posibles respuestas: y = 2vi — 1 . 5 V 2 + . 5 v 3 , 
y = 2vi — 2 v 3 + v 4 , y = 2v¡ + 3 v 2 — 7v 3 + 3v 4 

3. y = —3vi + 2v 2 + 2v 3 . Los pesos suman 1, por lo que es una 
suma afín. 

5. a) pi = 3bi — b 2 — b 3 e aff S porque los coeficientes 
suman 1 . 

b) P 2 = 2b 1 + 0 b 2 +b 3 i aff S porque los coeficientes 
no suman 1 . 

c) P 3 = — bi + 2b 3 + 0 b 3 e aff S ya que los coeficientes 
suman 1 . 

7. a) p! e Gen S, pero pi <t aff S 

b ) P 2 e Gen 5, y p 2 e aff S 

c) P 3 £ Gen S, por lo que p 3 £ aff S. 


5. -4vi + 5 v 2 - 4v3 + 3 v 4 = 0 

7. Las coordenadas baricéntricas son (—2, 4, — 1). 

11. Cuando un conjunto de cinco puntos se traslada restándole, 
por ejemplo, el primer punto, entonces el nuevo conjunto 
de cuatro puntos debe ser linealmente dependiente, de acuerdo 
con el teorema 8 de la sección 1.7, porque los cuatro puntos 
están en IR 3 . Según el teorema 5, el conjunto original de 
cinco puntos es afínmente dependiente. 

13. Si ¡vi, V 2 ¡ es afínmente dependiente, entonces existen 
c\ y C 2 , sin que ambos sean cero, tales que c\ + C 2 = 0 
y ciVi + C 2 V 2 = 0. Demuestre que esto implica que Vi = V 2 . 
Para lo inverso, suponga que Vi = V 2 y seleccione c 3 y C 2 
específicos que muestren su dependencia afín. 


9. 

13. 


'-3' 

0 

y y 2 = 

1 ' 

2 

. Otras respuestas son posibles. 

15. a) Los vectores v 3 — v¡ = 

" 1 ' 

2 

y V 3 - Vi = 

3" 

—2 


Gen {V2 — Vi, V3 — Vi} es un plano si y solo si 
{V2 — Vi, V3 — Vi} es linealmente independiente. Suponga 
que C 2 y C 3 satisfacen C 2 O 2 — vi) + C 3 (V 3 — vi) = 0 . 
Demuestre que esto implica C 2 = c 3 = 0. 


múltiplos y entonces son linealmente independientes. 

De acuerdo con el teorema 5, S es afínmente independiente. 

V) P>~(—f.f.Í).p 2 ~(0,M),p 3 ~(f,-Í, 

P4-(i-y),P 5 -(y.§) 


-ih 


15. Sea S = {x : Ax = b¡. Para probar que S es afín, es suficiente 
demostrar que S es un plano afín, de acuerdo con el teorema 3. 
Sea W = ¡x : Ax = Oj. Entonces, W es un subespacio de IR", de 
acuerdo con el teorema 2 de la sección 4.2 (o el teorema 12 
de la sección 2.8). Como S = W + p, donde p satisface 
Ap = b, de acuerdo con el teorema 6 de la sección 1.5, S 
es un traslado de W, y por lo tanto, S es un plano afín. 

17. Un conjunto conveniente consta de cualesquiera tres vectores 
que no sean colineales y tengan 5 en su tercer entrada. Si 5 es 
su tercera entrada, estos se encuentran en el plano z = 5. Si los 
vectores no son colineales, entonces su envoltura afín no puede 
ser una recta, así que debe ser un plano. 

19. Si p, q e/(S), entonces existen r, s e S tales que /( r) = p 
y /(s) = q. Dado cualquier t e IR, debe demostrarse que 
z = (1 — f)p + ?q está en f(S). Ahora utilice las definiciones 
de p y q, y considere el hecho de que/es lineal. 


c) p 6 es (-, -, +), p 7 es (0, +. -) y p 8 es (+, +, -) 

17. Suponga que S = ¡bi,..., b*} es un conjunto afínmente 

independiente. Entonces, la ecuación (7) tiene una solución 
porque p está en aff S. Por lo tanto, la ecuación (8) tiene una 
solución. Según el teorema 5, las formas homogéneas de los 
puntos en S son linealmente independientes. Por lo que (8) 
tiene solución única. Entonces (7) también tiene solución 
única, porque (8) contiene ambas ecuaciones que aparecen 
en (7). 

El siguiente argumento es similar a la demostración 
del teorema 7 de la sección 4.4. Si S = {bi,..., b 7 ¡ es 
un conjunto afínmente independiente, entonces existen 
escalares C\,..., Ck que satisfacen (7), por definición de aff S. 
Suponga que x también tiene la representación 

x = di bi + • • • + dk b¿ y di 4- • • • + dk — 1 (7a) 


21. Como B es afín, el teorema 1 implica que B contiene todas 
las combinaciones afines de puntos de B. Por lo tanto. B 
contiene todas las combinaciones afines de puntos de A. 

Es decir, aff A C B. 

23. Como A C (A U B), del ejercicio 22 se deduce que 

aff A C aff (A U B). De forma similar, aff B C aff (A U 6 ), 
de manera que [aff A U aff B] C aff (A U B). 


para escalares di,..., di . Entonces, la resta produce la ecuación 

0 = x — x = (ci - di)h { 4 -1- (c k - dk)b k (7b) 

Los pesos en (7b) suman cero porque las c y las d suman 1 por 
separado. Esto es imposible, a menos que cada peso en ( 8 ) sea 
igual a 0, ya que S es un conjunto afínmente independiente. 
Esto demuestra que c¡ = d¡ para i — I,..., k. 
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19. Si {pi, p 2 - P 3 } es un conjunto afínmente dependiente, 
entonces existen escalares ci, c 2 y c 3 , no todos cero, tales 
que dP! + C 2 P 2 + C 3 P 3 = 0 y ci + c 2 + c 3 = 0. 

Ahora utilice la linealidad de /. 


b ) Una posibilidad es dejar que A esté formado por dos 
esquinas adyacentes de un cuadrado, y B por las otras 
dos esquinas. Entonces, ¿qué son (conv A) U (conv B), 
y conv (A U B)? 


21. Sea a = 


b = 


y c = 


. Entonces, 


det [ á b c I = det 


det 


di 

a 2 

bi 

b 2 

Cl 

c 2 


, por la propiedad del determinante de la 


21 . 


a 1 

bi 

Cl 

Pl 

a 2 

b 2 

C 2 

„ /1 \ 

_ 1 

1 

1 

f °(i) 


MI) 



P2 


Po 


23. g(í) = (l-í)fo(0 + ífi(0 


transpuesta (teorema 5 de la sección 3.2). Por el ejercicio 30 
de la sección 3.3, este determinante es igual a 2 veces el 
área del triángulo con vértices en a, b y c. 


23. Si [ a b c 


r 

s 

t 


p, entonces la regla de Cramer da 


r = det [ p b c]/det[á b c ]. Por el ejercicio 21, 
el numerador de este cociente es dos veces el área 
del Apbc. y el denominador es el doble del área del Aabc. 
Esto demuestra la fórmula para r. Las otras fórmulas se 
pueden probar empleando la regla de Cramer para s y t. 


= (1 - 0[(1 - OPo + fPi] + í[(! - OPi + fp 2 ] 

= (1 - í) 2 Po + 2í(l - ÓPi + í 2 P 2 - 

La suma de los pesos en la combinación lineal para g es 
(1 — t) 2 + 2í(l — t) + t 2 , que es igual a 
(1 — 2 1 + t 1 ) + (2 1 — 21 2 ) + t 2 = 1. Cada uno de los 
pesos está entre 0 y 1 cuando 0 St< 1, así que g(f) 
está en conv ¡po, pi, p 2 J. 

Sección 8.4, página 467 

1. /(.Ti, x 2 ) = 3xi + 4x 2 y d = 13. 


Sección 8.3, página 459 
3. Ninguno está en conv S. 

5. P[ = —|vi + |v 2 + |V 3 + ^ v 4 , por lo que p¡ i conv S. 

P 2 = | v t + fv 2 + ¿v 3 + |v 4 , por lo que p 2 e conv S. 

7. a) Las coordenadas baricéntricas de pi, p 2 , p 3 y p 4 son, 
respectivamente, (|, i, ±), ( 0 , ±), (i,-±, f) y 

(I 3 _I) 

b) P 3 y p 4 están fuera de conv T. pi está dentro de conv T. p 2 
está en la arista vyvy de conv T. 

9. pi y P 3 están fuera del tetraedro conv S. p 2 está sobre la cara 
que contiene los vértices v 2 , v 3 y v 4 . p 4 está dentro de conv S. 
ps está sobre la arista entre vi y V3. 

13. Si p, q e f(S), entonces existen r, s e S tales que /(r) = p 
y /(s) = q. El objetivo es mostrar que el segmento de recta 
y = (1 — ?)P + ?q. para 0 ^ t £ 1, está en f(S). Utilice la 
linealidad de / y la convexidad de S para demostrar que 
y = /( w ) para alguna w en S. Esto probará que y está 
en f(S) y que f(S) es convexo. 

15. p = f Vl + iv 2 + |v 4 y p = |v! + \y 2 + |v 3 . 

17. Suponga que A C B. donde B es convexo. Entonces, como 
B es convexo, el teorema 7 implica que B contiene todas 
las combinaciones convexas de puntos de B. Por lo tanto, 

B contiene todas las combinaciones convexas de puntos de A. 
Es decir, conv A C B. 

19. a) Con base en el ejercicio 18, demuestre que conv A y conv 
B son subconjuntos de conv (A U B). Esto implicará que su 
unión también es un subconjunto de conv (A U B). 


3. a) Abierto b) Cerrado c) Ni abierto ni cerrado 
d ) Cerrado e) Cerrado 

5. a) No es compacto, convexo 

b ) Compacto, convexo 

c) No es compacto, convexo 

d ) No es compacto, no es convexo 

e) No es compacto, convexo 

'°1 

2 o un múltiplo 


7. a) n = 


b ) /(x) = 2 x 2 + 3x 3 , d = 11 


9. a) n = 


3 

-1 

2 

1 


o un múltiplo 


b) f (x) = 3xi — x 2 + 2x 3 + x 4 , d = 5 

11. v 2 está en el mismo lado que 0. vi está en el otro lado, 
y v 3 está en H. 


13. 


Una posibilidad es p = 


v 2 


-4 

1 

0 

1 


32' 


" 10' 

-14 


-7 

0 

. Vi = 

1 

0 


0 


15. /(xi, x 2 , x 3 ) = Xi — 3x 2 + 4x 3 — 2x 4 y d = 5 
17. /(xi, x 2 , x 3 ) = x'i — 2x 2 + x 3 y d = 0 
19. /(xi, x 2 , x 3 ) = —5.\'i + 3x 2 + x 3 y d = 0 
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23. /(.ti, X 2 ) — 3ti — 2x 2 con d que satisface 9 < d < 10 es una 
posibilidad. 

25. f(x, y) — 4t + 1. Una elección natural para d es 12.75, que es 
igual a/(3, .75). El punto (3, .75) es 3/4 de la distancia entre 
el centro 6(0, 3) y el centro de 6(p, 1). 

27. El ejercicio 2a) de la sección 8.3 da una posibilidad. O bien, 
sea S = {(t, y) : x 2 y 2 = 1 y y > 0 j. Entonces, conv S es 
el semiplano superior (abierto). 

29. Sean x, y e 6(p, S) y suponga que z = (1 — f)x + fy, donde 
0 S(< 1 . Después, demuestre que 

llz-pll = ||[(i - 0 X + fy] -p|| 

= ||(i -f)(x-p) + ?(y-p)ll <$■ 

Sección 8.5, página 479 

1. a) m = 1 en el punto p¡ b) m = 5 en el punto P 2 
c ) m = 5 en el punto P 3 

3. a) m = — 3 en el punto P 3 

b) m = 1 en el conjunto conv {pi, P 3 } 

c) m = —3 en el conjunto conv {pi, p 2 ) 

5 ¡r°i r 5 i [ 4 i r°i! 

ÍL°J' L°J’ L 3 J’ L 5 Ji 

7 . ![ 0 U 7 U 6 U°1! 

IL°J L°J L 4 J L 6 Jl 

9. El origen es un punto extremo, pero no es un vértice. Explique 
por qué. 



11. Una posibilidad es hacer que S sea un cuadrado que incluya 
parte de la frontera, pero no toda. Por ejemplo, que incluya 
solamente dos aristas adyacentes. La envoltura convexa del 
perfil P es una región triangular. 



13. a) fo(C 5 ) = 32, /,(C 5 ) = 80, / 2 (C 5 ) = 80, 
MC 5 ) = 40, MC 5 ) = 10, y 
32 - 80 + 80 - 40 + 10 = 2. 



15. a) f 0 (P n ) = MQ)+l 

b) fk(P n ) = fk(Q) + fk-i(Q) 

C ) fn—i(P") = fn-l(Q) + 1 

19. Sean S convexo y x e cS 4 dS, donde c > 0 y d > 0. 

Entonces, existen Si y s 2 en S tales que x = csi + 4s 2 . 

Pero entonces, 

( c d \ 

x = csi + ds 2 = (c + d)\ -rSi 4- 7 s 2 . 

\c + d c + d ) 

Ahora demuestre que la expresión en el lado derecho es un 
miembro de (c + d)S. 

Para el inverso, tome un punto típico en (c + d)S y 
demuestre que está en cS + dS. 

21. Sugerencia: Suponga que Ay B son convexos. Sean x, 
y e A + B. Entonces, existen a, ceAyb, deí tales que 
x = a + byy = c + d. Para cualquier t tal que 0 £ t £ 1, 
demuestre que 

w — (1 — t)x 4 ty — (1 — Z)(a + b) + t(c + d) 
representa un punto en A + 6 . 

Sección 8 . 6 , página 490 

1. Los puntos de control para x(t) + b deberían ser po + b, 

Pi + b y P 3 + b. Escriba la curva de Bézier que pasa 
a través de esos puntos, y pruebe algebraicamente que 
esta curva es x(/) + b. 

3. a) x'(t) = (—3 4- 6í — 3t 2 )p 0 + (3 — 12? 4- 9r 2 )p 1 + 

(6? — 9? 2 )p 2 + 3? 2 p 3 por lo que 
x'(0) = —3p 0 4- 3p t = 3(p! - p 0 ) y 
x'(l) = —3p 2 + 3p 3 = 3(p 3 — pU. Esto demuestra que 
el vector tangente x'( 0 ) apunta en la dirección de po a pi 
y es tres veces la longitud de pi — po. De igual manera, 
x'(l) apunta en la dirección de p 2 a p 3 y es tres veces la 
longitud de p 3 — p 2 . En particular, x'(l) = 0 si y solo 
SÍ p 3 = p 2 . 

b) x"(?) = (6 - 6?)p 0 + (-12 + 18?)p, 

4-(6 — 18?)p 2 4- 6?p 3 así que 
x"(0) = 6p 0 - 12p, 4- 6p 2 = 6(p 0 - p t ) + 6(p 2 - p,) 

y 

x"(l) = 6p, - 12p 2 4- 6p 3 = 6(p t - p 2 ) 4- 6(p 3 - p 2 ). 
Para un esquema de x"(0), construya un sistema de 
coordenadas con el origen en p 3 , temporalmente, y etiquete 
po como po — pi, y p 2 como p 2 — pi. Por último, construya 
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una recta de este nuevo origen a través de la suma de 
Po - Pi y P2 - Pi, extendiéndose un poco. Esta recta 
apunta en la dirección de x"(0). 



W = (Po- Pl) + fP2-Pl) = ^ x "(°) 


5. a) Del ejercicio 3a) o de la ecuación (9) en el libro, 
x'(l) = 3(p 3 - p 2 ) 


1 - 4í + 6t 2 - 

- 4í 3 

+ ?4 1 


41 - 

12 1- 

■ + 12í 3 - 

■4í 4 


61 

2 _ 

12 f 3 

6í 

4 



4 1 

3 — 4í 4 





? 4 


_ 



' 1 

-4 

6 

-4 

1 


0 

4 

— 12 

12 

-4 

= 

0 

0 

6 

-12 

6 


0 

0 

0 

4 

-4 


0 

0 

0 

0 

1 


' 1 

-4 

6 

-4 

1 


0 

4 

-12 

12 

-4 

B — 

0 

0 

6 

-12 

6 


0 

0 

0 

4 

-4 


0 

0 

0 

0 

1 


Utilice la fórmula para x'(0), con los puntos de control 
de y(f), y obtenga 

y'(0) = 3p 3 + 3p 4 = 3(p 4 - p 3 ) 

Para continuidad C 1 , 3(p3 — p 2 ) = 3(p4 — P3), de manera 
que P3 = (P4 + p 2 )/2, y P3 es el punto medio del segmento 
de recta de p 2 a P4. 

b) Si x'(l) = y'(0) = 0, entonces p 2 = P3 y P3 = P4. 

Así, el “segmento de recta” de p 2 a P4 es justamente el 
punto P3. [Nota: En este caso, la curva combinada sigue 
siendo continua C l , por definición. Sin embargo, algunas 
elecciones de los otros puntos de “control”, po, pi, ps y P6, 
pueden producir una curva con una esquina visible en p 3 ; 
en tal caso la curva no es continua G 1 en P3]. 

7. Sugerencia: Utilice x"(í) del ejercicio 3 y adapte esto para 
la segunda curva para ver que 

y"(O = 6(1 - í)p 3 + 6(—2 + 3í)p 4 + 6(1 - 3r)p 5 + 6/p 6 

Entonces, sea x"(l) = y"(0). Como la curva es continua 
C 1 en P3, el ejercicio 5a) indica que el punto p 3 es el 
punto medio del segmento de p 2 a p 4 . Esto implica que 
P 4 — P 3 = P 3 — p 2 . Utilice esta sustitución para probar 
que p 4 y ps están unívocamente determinados por pi, p 2 
y P3. Solamente p¿ se puede seleccionar arbitrariamente. 


13. a) Sugerencia: Aplique el hecho de que qo = po- 

b ) Multiplique la primera y la última partes de la 
ecuación (13) por | y despeje 8q 2 . 

c) Utilice la ecuación (8) para sustituir 8q 3 y después 
aplique el inciso a). 


15. a) De la ecuación (11), y'(1) = .5x'(0.5) = z'(0). 

b) Observe que y'(l) = 3(q3 — q 2 ). Esto se deduce de la 
ecuación (9), con y(í) y sus puntos de control en lugar 
de x(t) y los puntos de control de esta. De forma similar, 
para z (t) y sus puntos de control, z'(0) = 3(iq — ro). 

Por el inciso a), 3(q3 — q 2 ) = 3(r¡ — ro). Remplace ro por 
q 3 , y obtenga q 3 - q 2 = rj - q 3 , así que q 3 =(q 2 + r¡)/2. 

c) Sean q 0 = p 0 y r 3 = p 3 . Calcule qi = (p 0 + pi)/2 y 
r 2 = (p 2 + p 3 )/2. Calcule m = (pi + p 2 )/2. 

Calcule q 2 = (qi + m)/2 y ri = (m + r 2 )/2. Calcule 
q3 = (q 2 + rO/2 y sea r 0 = q 3 . 


17. a) r 0 = p 0 , r! = 


Po + 2P! 


r 2 Pi + P 2 _ _ 

r 2 — -;-. r 3 — P2 


b ) Sugerencia: Escriba la fórmula estándar (7) en esta sección, 
con r, en vez de pi para i = 0...., 3, y después remplace 
r 0 y r 3 por po y p 2 , respectivamente: 

x(t) = (1 - 3í + 3 1 2 - í 3 )p 0 

+ (3 1 — 6 1 2 + 3t 3 )ri (iii) 

+ (3 t 2 - 3t 3 )r 2 + t 3 p 2 


9. Escriba un vector de los pesos polinomiales para x(f), expanda 
los polinomios de pesos, y factorice el vector como Mgu(í): 


Aplique las fórmulas para ri y r 2 del inciso a) para examinar 
el segundo y tercer términos en esta expresión para x(í). 
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ortogonal, 338-339, 395 
ortonormal, 342-344, 351, 356 
polinomios, 192, 193 
factible, 412 
finito, 226 

fundamental de soluciones, 249, 312 
generador, 194, 212 
teorema del, 210-211 
indexado, 56, 208 
infinito, 225n 

linealmente independiente, 56, 57-58, 
208-216 
nivel, 462 

vector. Véase Conjunto de vectores 
Conmutatividad, 98, 160 
Constante de ajuste positiva, 251 
Continuidad 

de curvas de Bézier cuadráticas/cúbicas 
geométrica (G°, G 1 ), 483 
paramétrica (C°, C\ C 2 ), 483, 484 
geométrica, 483 


Contraejemplo, 61 

Contraste entre Nul A y Col A, 202-203 
Convergencia, 135, 258-259 
Coordenadas 
afines, 447-451 
baricéntricas, 447-451 
definición de, 447 
en gráficos generados por 
computadora, 449-451 
interpretaciones físicas y geométricas 
de, 448-449 

homogéneas, 139-140, 141-142 
polares, A6 
RGB, 449-450 

Correlación, coeficiente de, 336 
Corriente 

de la rama, 83 
del circuito, 82 
Covarianza 

matriz de, 425-427, 429 
de la muestra, 426 
Cristalografía, 217-218 
Cuadrado unitario, 72 
Cubo, 435, 436 
en cuatro dimensiones, 435 
Curva cúbica 

de Bézier, 460, 481-482, 484, 485, 
491-492 
de Hermite, 485 

D 

Datos multivariados, 424, 428-429 
Definición implícita de Nul A, 148, 200, 
204 
Demanda 

final, cuenta de, 132 
intermedia, 132 
Dependencia 
afín, 445, 451 
definición de, 444 
dependencia lineal y, 445-446, 452 
lineal, 56-57, 58 (fig.), 208, 444 
dependencia afín y, 445-446, 452 
espacio columna, 211-212 
matrices equivalentes por filas, Al 
operaciones de fila, 233 
Depredador-presa, modelo, 302-303 
Desarrollo por cofactores, 165-166, 172 
Descomposición 
de fuerzas, 342 

en valores singulares, 130, 414-424 
análisis de componentes principales, 
429 

cálculo del rango de matriz, 157, 417 
matriz de m x n, 416-417 
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número de condición, 420 
rango de matriz, 417 
reducida, 422 
seudoinversa, 422 

solución con mínimos cuadrados, 422 
subespacios fundamentales, 420-421 
teorema de, 417 
vectores singulares, 417 
espectral, 398-399 
ortogonal, 339-340, 348 
polar, 432 

valor singular, 414-424 
vector propio, 302, 319 
Descripción(es) 

explícita, 44, 148, 200-201, 203 
geométricas 

de Gen {u, vj, 30-31 
de Gen {v}, 30-31 
de IR 2 , 25-26 
implícita, 44, 263 
Desigualdad 
de Bessel, 390 

de Cauchy-Schwarz, 379-380 
del triángulo, 380 
Determinante(s), 163-187, 274-275 
adjunta, 179 

área y volumen, 180-182 
de Casorati, 245 
definición recursiva, 165 
desarrollo por cofactores. 165-166, 172 
e inversa, 103. 171, 179-180 
ecuación característica, 276-277 
forma escalonada, 171 
interpretación geométrica, 180, 

275 (fig.) 
matriz 

de 3x3, 164 
de n x n, 165 
elemental, 173-174 
triangular, 167, 275 
operaciones 

de columna, 172 
de fila, 169-170, 174 
producto de pivotes, 171, 274 
propiedad 

de linealidad, 173, 187 
multiplicativa, 173, 277 
propiedades de, 275 
regla de Cramer, 177-180 
simbólico, 464 
transformaciones, 182-184 
valores propios, 276, 280 
volumen, 180-182, 275 
Véase también Matriz 
Diagonal principal, 92 


Diagonalización ortogonal, 396 

análisis de componentes principales, 427 
descomposición espectral, 398-399 
forma cuadrática, 402-403 
Dieta de Cambridge, 80-81, 86 
Diferenciación, 205 

Dimensión (espacio vectorial), 153-160, 
225-228 

clasificación de subespacios, 226-227 
espacio 

columna, 155, 228 
fila, 233-234 
nulo, 155, 228 
subespacio, 155-156 
Dimensión(es) 

de un plano (o un conjunto), 440 
espacial, 425 
espectral, 425 

Dinámica de fluidos computacional (DFC), 
91 

Dirección de mayor 
atracción, 304, 314 
repulsión, 304, 314 
Diseño de aeronave, 91, 117 
Dispersión, matriz de, 91, 135, 172 
Distancia 

entre vectores, 332-333 
y subespacio, 340-341, 351 
Distorsión, 163 
Dodecaedro, 435, 436 
Dominio, 63 

E 

Earth Satellite Corporation, 394 
Ecuación(es) 
auxiliar, 248 
característica, 276-277 
de la matriz, 273-281, 295 
de precio, 137 
de producción, 133 
de tres momentos, 252 
de una recta, 45, 69 
diferencial, 204-205, 311-319 
funciones propias, 312 
problema de circuitos, 312-313, 
316-317,318 

problema de valor inicial, 312 
sistema desacoplado, 312, 315 
soluciones de, 312 
en diferencias, 80, 84-85, 244-253 
conjuntos solución de, 247, 248-249, 
250 (fig.) 

de primer orden, 250 

dimensión del espacio solución, 249 

homogénea, 246, 247-248 


lineal, 246-249 

modelo de espacio de estados, 264 
modelo de matrices por etapas 
(de estados), 265-266 
modelo de población, 84-85 
no homogénea, 246, 249-250 
procesamiento de señal, 246 
reducción a primer orden, 250 
relación de recurrencia, 84, 246, 248 
vectores propios, 271, 279, 301 
lineal, 2-12, 45, 368-369 
mal condicionada, 364 
matricial, 34-36 
normal, 329, 361-362, 364 
mal condicionada, 364 
paramétrica, 44-46 
químicas, 51, 54 
vectorial, 24-34, 48 
paramétrica, 44, 46 
relación de dependencia lineal, 56-57 
Eje(s) 

imaginario, A5 
real, A5 

Elementos (Platón), 435 
Eliminación de Gauss, 12n 
Elipse(s), 404 
área de, 184 

valores singulares de, 415-416 
Encuesta Nacional Geodésica (National 
Geodetic Survey), 329 
Entrada(s) 

de la diagonal, 92 
principal, 12-13 
secuencia de, 264 
Envoltura 

afín (o afín generado), 437, 454 
de dos puntos, 446 
punto de vista geométrico de, 441 
convexa, 454, 472 

caracterización geométrica de, 456-457 
de conjunto abierto, 465 
de conjunto cerrado, 465, 466 
de conjunto compacto, 465, 467 
de puntos de control de la curva de 
Bézier, 488 (fig.) 

Equilibrio inestable, 310 
Error(es) 

cuadrático medio, 388 

de redondeo, 9, 114, 269, 358, 417, 420 

relativo, 391 

Véase también Número de condición 
Escala, matriz de, 173 
Escalar, 25, 190, 191 

producto. Véase Producto interno 
Escalera, red de, 128-129, 130-131 
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Espacio(s) 

columna, 201-203 

base para, 149-150,211-212, 231-232 
dimensión de, 228, 233 
espacio nulo y, 202-204 
problema de mínimos cuadrados, 
360-362 

subespacio, 147-148, 201 
con producto interno, 376-390 
definición de, 376 

desigualdad de Cauchy-Schwarz en, 
379-380 

desigualdad del triángulo en, 380 
distancias en, 377 
en series de Fourier, 387-388 
longitudes (normas) en, 377 
mejor aproximación en, 378-379 
mínimos cuadrados ponderados, 
383-385 

ortogonalidad en, 377 
para análisis de tendencia de datos, 
385-386 

proceso de Gram-Schmidt en, 377-378 
de dimensión infinita, 226 
fila, 231-233 
base, 231-233 
dimensión de, 233 
teorema de la matriz invertible, 235 
nulo, 147-148, 198-201 
base, 149, 211-212, 231-232 
descripción explícita de, 200-201 
dimensión de, 228, 233-234 
espacio columna y, 202-203 
espacio propio y, 268 
transformación lineal, 203-205 
propio, 268-269 

base ortogonal para, 397 
dimensión de, 285, 397 
vectorial, 189-264 
axiomas, 191 
complejo, 190n, 295, 308 
de dimensión finita, 226, 227-228 
de dimensión infinita, 226 
de flechas, 191 
de funciones, 192, 380 
de polinomios, 192, 377 
de señales de tiempo discreto, 191-192 
ecuaciones diferenciales y, 204-205, 
312 

ecuaciones en diferencias y, 248-250 
real, 190n 
Estado 
estable 

flujo de calor, 131 
respuesta de, 301 


temperatura de, 11, 87, 131 
vector de, 257-260, 266-267, 279 
-espacio, modelo de, 264, 301 
Estrictamente dominante, valor propio, 

319 

Estrictamente separados, hiperplanos, 

466 

Euler, Leonard, 479 
Excentricidad de órbita. 374 
Existencia de solución, 64, 73 
Expansión columna-fila, 119 

F 

Faceta de polítopo, 470 
Factorización 

análisis de un sistema dinámico, 281 
de matrices (descomposición), 92, 
123-132 

completa QR, 359 
de Cholesky, 406, 432 
de Schur, 391 

descomposición en valores singulares, 
130, 414-424 

diagonal, 281-288, 291-292 
en ingeniería eléctrica, 127-129 
espectral, 130, 398-399 
LU, 92, 124-127, 130, 323 
permutada, 127 
polar, 432 
por bloques, 120 
QR, 130, 356-358, 364-365 
rango, 130 
reducida DVS, 422 
reducida LU, 130 
reveladora de rango, 432 
semejanza, 277, 292-293 
transformaciones lineales, 288-295 
valor propio complejo, 299-300 
diagonal, 281, 292 
en ingeniería eléctrica, 127-129 
para un sistema dinámico, 281 
valor propio complejo, 299 
Fase 

regresiva, 17, 20, 125 
progresiva, 17, 20 
Feynman, Richard, 163 
Fila 

columna, regla de, 96 
diferente de cero, 12 
vector, 231 
regla de, 38 
Filtro lineal, 246 
pasa bajos, 247, 367 
promedio móvil, 252 
Física, coordenadas baricéntricas en, 448 


Flujo 

de corriente, 82 
en red, 52-53, 54-55, 82 
negativo, en una rama de una red, 82 
Forma 

cuadrática, 401-408 
cambio de variable, 402-403 
clasificación, 405-406 
diagonalización ortogonal, 402-403 
ejes principales de, punto de vista 
geométrico de, 403-405 
indefinida, 405 
máximo y mínimo, 408-413 
negativa definida, 405 
positiva definida, 405 
término de producto cruz, 401 
de desviación de la media, 370, 425 
de Jordán, 292 
escalonada, 12, 13 

base para espacio de filas, 231-233 
determinante, 171, 274 
factorización LU, 124-126 
flops, 20 

posiciones pivote, 14-15 
reducida, 13, 14, 18-21, 200, 

231-233, Al 
sistema consistente, 21 
homogénea(s) 

de v en IR", 441-442 
e independencia afín, 445, 452 
negativa semidefinida, 405 
Fortran, 39 
Fourier 

aproximación de, 387 
coeficientes de, 387 
series de, 387-388 
Fuente de sistema dinámico, 314 
Fuerza, descomposición de, 342 
Función(es), 63 

continuas, 196, 205, 230, 380-382, 387-388 
de transferencia, 122 
propias, 312, 315-316 
tendencia, 386 
utilidad, 412 
Funcional(es) 
cero, 461 

lineales, 461, 466, 472 
valor máximo de, 473 

G 

Gauss, Cari Friedrich, 12n, 374n 
Gen 

{u, v) como un plano, 30 (fig.) 

{v} como una recta, 30 (fig.) 

30, 194 
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Generación, 30, 36-37 
afín, 437 

independencia lineal, 58 
proyección ortogonal, 340 
subespacio. 156 
Geometría 

de espacios vectoriales, 435-492 
combinaciones afines, 436-444 
combinaciones convexas, 454-461 
curvas y superficies de, 481-492 
hiperplanos, 435, 440, 461-469 
independencia afín, 444-454 
polítopos, 469-481 
vector de, 486 
Givens, rotación de, 90 
Gradiente, 462 
Gráfica de dispersión, 425 
Gráficos generados por computadora, 138 
centro de proyección, 142 
coordenadas 

baricéntricas en, 449-451 
homogéneas, 139, 141-142 
curvas de Bézier en, 481, 482 
proyecciones en perspectiva, 142-144 
transformaciones 
compuestas. 140 
de trasquilado, 139 
3D, 140-142 
Gram, matriz de, 432 

Gram-Schmidt, proceso de, 354-360, 377-378 
en espacios con producto interno, 
377-378 
en P 4 , 378, 386 
en IR", 355-356 
polinomios de Legendre, 383 

H 

Hermite 

curva cúbica de, 485 
polinomios de, 229 
Hilbert, matriz de, 116 
Hipérbola, 404 
Hipercubo, 477-479 
construcción de un, 477-478 
Hiperplano(s), 435, 440, 461-469 
conjuntos de separación, 465-467 
de soporte, 470 
definición de, 440 

descripciones explícitas de, 462-464 
descripciones implícitas de, 461-464 
estrictamente separados, 466 
paralelos, 462-464 
Householder, matriz de, 390 
reflexión de, 161 
Howard, Alan H., 80 


I 

Icosaedro, 435, 436 
Imagen, vector de, 63 
Independencia 
afín, 444-454 

coordenadas baricéntricas, 447-453 
definición de, 444 
lineal, 55-62, 208 
conjuntos, 56, 208-216, 227 
de las columnas de una matriz, 57, 77 
en P 3 , 220 
en IR",59 
señales, 245-246 
vector cero, 59 
vectores propios, 270 
Indiferencia, curva de, 412-413 
Intercambio, matriz de, 106, 173 
Interpolación de polinomios, 23, 160 
Interpretación de gráficas, 487 
Inversa, 103 
algoritmo para, 107-108 
columnas aumentadas, 108 
determinante, 103 
fórmula, 103, 179 
matriz 

de flexibilidad, 104 
de rigidez, 104-105 
elemental, 106-107 
mal condicionada, 114 
particionada, 119, 122 
método de potencia, 322-324 
Moore-Penrose, 422 
número de condición, 114, 116 
producto, 105 
transformación lineal, 113 
transpuesta, 105 

Isomórficos, espacios vectoriales, 155, 

230 

Isomorfismo, 155, 220-222, 249, 378n 

J 

Jordán, Wilhelm, 12n 

K 

k- cara, 470 
Ir-pirámide, 480 
k-polítopo de cruce, 480 

L 

Laguerre, polinomio de, 229 

Lamberson, R., 265 

Landsat, imágenes, 393-394, 429, 430 

LAPACK, 100, 120 

Laplace, transformada de, 122, 178 

Legendre, polinomio de, 383 


Leontief, Wasily, 1, 132, 137n 
ecuación de producción, 133 
modelo 

de entrada-salida, 132-138 
de intercambio, 49 
Ley(es) 

asociativa (multiplicación), 97, 98 
de corriente, 83 
de Hooke, 104 
de Kirchhoff, 82, 83 
de los cosenos, 335 
de Ohm, 82 
distributiva(s), 97, 98 
derecha, 97 
izquierda, 97 

Longitud de vector, 331-332, 377 
valores singulares, 416 

M 

Macromedia Freehand, 481 
Malla de alambre 

aproximación de, 449 
modelos de, 91, 138 
Mapeo, 63 

composición de, 94 
de coordenadas, 216-217, 219-222, 
239 

factorización de matrices, 288-289 
procesamiento de señales, 248 
sobre IR m , 75, 77 
uno a uno, 75-77 
vectores propios, 290-291 
Maple, 279 

Mark II computadora, 1 
Masa-resorte, sistema, 196, 205, 214 
Masas puntuales, 33 
Matemático(s) 
ecologistas, 265 

modelo. Véase Modelo matemático 
Mathematica, 279 

MATLAB, 23, 116, 130, 185, 262, 279, 
308, 323, 324, 327, 359 
Matrices, 92-161 
adjunta, 179 
anticonmutativa, 160 
aumentada, 4 
B, 290 
banda, 131 
base de Bézier, 485 
bidiagonal, 131 

cambio de coordenadas, 219, 240-241 
cero, 92 

columnas ortonormales, 343-344 
compañera, 327 
complemento de Schur, 122 
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conmutatividad, 98, 103, 160 

cuadrada, 111, 114 

de cambio de coordenadas, 219, 

240-241 

de Casorati, 245-246 
de coeficientes, 4, 37 
de cofactores, 179 
de consumo, 133-135, 137 
de controlabilidad, 264 
de costo unitario, 67 
de covarianza, 425-427 
de diseño, 368 
de dispersión, 91, 135, 172 
de espín de Pauli, 160 
de flexibilidad, 104 
de forma cuadrática, 401 
de geometría (de una curva de Bézier), 
485 

de Gram, 432 
de Hilbert, 116 
de Householder, 161, 390 
de m x n, 4 

de migración, 85, 254, 279 
de observaciones, 424 
de rigidez, 104-105 
de transferencia, 128-129 
de una transformación lineal, 70-80, 
289-290 

de Vandermonde, 160, 186, 327 
diagonal, 92, 120, 281-288, 417-418 
diagonalizable, 282 
ortogonalidad, 396 
valores propios diferentes, 284-285 
valores propios que no son diferentes, 
285-286 
diseño de, 368 

ecuación característica, 273-281 
elemental, 106-107, 173-174, 390 
determinante, 173-174 
escala, 173 
intercambio, 173 
reflector, 390 
remplazo de filas, 173 
entrada principal, 12-13 
equivalente(s) por filas, 6, 13, 107, 

277, Al 

notación de, 18, 29n 
escala, 173 
escalonada, 14 
reducida, 14 
espacio 

columna, 201-203 
fila, 231-233 
nulo, 147-148. 198-201 
estándar, 71-72, 95, 288 


estocástica, 254, 261-262, 266-267 
regular, 258 

fila/columna distinta de cero, 13 

flexibilidad de, 104 

identidad, 38, 92, 97. 106 

iguales, 93 

intercambio. 173 

inversa, 103 

inversión de. 102-111 

invertible, 103, 105-107, 112-113. 171 

jacobiana, 304n 

mal condicionada, 114, 364, 391 
múltiple escalar, 93-94 
multiplicación de, 94-98, 118-119 
determinantes y, 172-173 
expansión columna-fila, 119 
por bloques, 118 
propiedades de, 97-98 
regla fila-columna, 96 
no singular, 103, 113 
notación, 4 
ortogonal, 344, 395 
ortonormal, 344n 
particionada, 91, 117-123 
adición y multiplicación, 118-119 
algoritmos, 120 
complemento de Schur, 122 
conformada, 118 
diagonal por bloques, 120 
expansión columna-fila, 119 
inversa de, 119-120, 122 
producto externo, 119 
submatrices, 117 

triangular superior por bloques, 119 
por bloques, 117 
diagonal, 120 
multiplicación, 118 
triangular superior, 119 
por etapas, modelo de, 265-266, 307-309 
positiva 

definida, 406 
semidefinida, 406 
potencias de, 98-99 
productos, 94-98, 172-173 
proyección, 398, 400 
rango de, 153-160 
regla fila-columna, 96 
semejantes, 277, 279, 280, 282, 292-293 
seudoinversa, 422 
simétrica, 324, 394-399 
diagonalización de, 395-397 
positiva definida/semidefinida, 405 
teorema espectral para, 397-398 
Véase también Forma cuadrática 
singular/no singular, 103, 113, 114 


sistema de, 122 
submatriz de, 117, 264 
suma de, 93-94 
suma de columna, 134 
tamaño de una, 4 
transpuesta de, 99-100. 105 
traza de, 294, 426 
triangular, 5 

determinantes, 167 
inferior, 115, 124, 125-126, 127 
superior, 115, 119-120 
valores propios, 269 
tri diagonal, 131 
vector 

columna, 24 
producto, 34-35, 38-39 
Máximo de forma cuadrática, 408-413 
Media de la muestra, 425 
Mejor aproximación 

a y por elementos de W, 350 
C[a, b], 386 
Fourier, 387 
P 4 , 378-379 
Método(s) 
de Jacobi, 279 
iterativos 

algoritmo QR, 279, 280, 324 
espacio propio, 320-321 
fórmula para (/ — C) -1 , 134-135, 137 
de Jacobi, 279 

de potencia inversa, 322-324 
de potencias, 319-322 
valores propios, 277, 319-325 
Microcircuito, 117 
Migración, matriz de, 85, 254, 279 
Mínima longitud, solución de, 433 
Mínimos cuadrados, 
ajuste de 

gráfica de dispersión, 371 
superficie de tendencia, 372 
tendencia cuadrática, 385-386 
tendencia cúbica, 372 (fig.) 
tendencia estacional, 373, 375 (fig.) 
tendencia lineal, 385-386 
ponderados, 376, 383-385 
solución de, 330, 360, 422 
cálculo alternativo, 364-366 
longitud mínima, 422, 433 
factorización QR, 364-365 
Mínimos de forma cuadrática, 408-413 
196 

Modelado molecular, 140-141 
Modelo 

de población de los búhos, 265-266, 
307-309 
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de redes eléctricas, 2, 82-83 
factorización de matrices, 127-129 
problema de circuitos, 312, 316-317, 
318 

realización mínima, 129 
general lineal, 371 
matemático, 1, 80-85 
aeronave, 91, 138 
búho manchado, 265-266 
depredador-presa, 302-303 
lineal, 80-85, 132, 266, 302, 371 
matriz por etapas, 265-266, 

307-309 
nutrición, 80-82 
población, 84-85, 254. 257-258 
red eléctrica, 82 

Véase también Cadena de Markov 
viga, 104 

multiplicador acelerador, 25 ln 
Módulo, A4 
Moebius, A. F., 448 
Moore-Penrose, inversa de, 422 
Muir, Thomas, 163 
Multiplicación 

por la derecha, 98, 176 

por la izquierda, 98, 106, 107, 176, 

358 

Multiplicidad 

algebraica de un valor propio, 276 
de valor propio, 276 
Múltiplo escalar, 24, 27 (fig.), 93-94, 

190 

N 

n-ada(s) ordenada!s), 27 

NAD (North American Datum), 329, 

330 

Negativo de un vector, 191 
No trivial, solución, 43 
Nodos, 52 

Norma de vector, 331-332, 377 
North American Datum (NAD), 329, 

330 

Notación matricial. Véase Sustitución 
regresiva. 

Núcleo, 203-205 
Nulidad, 233 
Número(s) 

complejo(s), A3-A7 
argumento de, A6 
conjugado, A4 
coordenadas polares, A6 
ejes reales e imaginarios, A5 
interpretación geométrica de, 

A5-A6 


partes reales e imaginarias, A3 
potencias de, A7 
IR 2 y, A7 

valor absoluto de, A4 
de condición, 114, 116, 176, 391 

descomposición en valores singulares, 
420 

imaginario(s) puro(s), A5 
Nutrición, modelo de, 80-82 

O 

Obras públicas, programas de, 412-413 
conjunto factible, 412 
curva de indiferencia, 412-13 
utilidad, 412 
Octaedro, 435, 436 
OpenGL, 481 
Operación(es) 

de fila, 6, 169-170 

determinantes, 169-170, 174, 275 
elementales, 6, 106 
existencia/unicidad, 20-21 
forma escalonada, 13 
inversas, 105, 107 
posiciones pivote, 14-15 
rango, 236, 417 

relaciones de dependencia lineal, 150, 
233 

sustitución regresiva, 19-20 
valores propios, 267, 277 
variable básica/libre. 18 
Véase también Sistema lineal 
de punto flotante (flop), 9, 20 
elemental de fila, 6, 106, 107 
Optimización con restricciones, 
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regresión, 432 
vectores, 333-334, 377 
propios, 395 

Ortogonalidad, 333-334, 343 
Ortogonalmente diagonalizable, 396 
Ortonormal(es) 
base, 342, 351, 356-358 
columnas, 343-344 
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hipercubo, 477-479 
¿-pirámide, 480 
¿-polítopo de cruce, 480 
representación 
explícita de, 473 
implícita de, 473-474 
mínima de, 471-472, 474-475, 

479 

simplejo, 435, 475-477 
Posición estándar, 404 
PostScript®, fuentes, 484-485, 492 
Potencia 

de un número complejo, A7 
de una matriz, 98-99 
método de, 319-322 
Precios 

de equilibrio, 49-51, 54 
ecuación de, 137 

Preguntas de existencia, 7-9, 20-21, 36-37, 
64, 72, 113 

Primer componente principal, 393, 427 
Probabilidad, vector de, 254 
Problema(s) 

de mínimos cuadrados, 329, 360-375 
ajuste de curva, 371-372 
columnas ortogonales, 364 


descomposición en valores singulares, 
422 

ecuaciones normales, 329, 361-362, 
370 

error, 363-364 

espacio columna, 360-362 
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a ecuación de primer orden, 250 
por filas, algoritmo, 15-17 
fase regresiva, 17, 20, 125 
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matriz del sistema, 122 
modelo del espacio de estados, 
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modelo de matriz por etapas, 265-266, 
307-309 
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modelo depredador-presa, 302-303 
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ecuaciones en diferencias, 246 
en economía, 49-51 
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no homogéneo, 44-46, 234 
notación matricial, 4 
sobredeterminado/subdeterminado, 23 
solución general, 18 
solución paramétrica, 19-20, 44 
matricial, 122 
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de descomposición 

en valores singulares, 417 
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del rango, 156, 233-234 
espectral, 397-398 
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Trasquilado 
escala y, 145 

transformación de, 65, 74, 139 
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64, 72 
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diagonalización, 281-288, 395-397 
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ecuaciones en diferencias, 271 
linealmente independientes, 270, 282 
operaciones de fila, 267 
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